您的位置:首页 > 其它

HANA不是一个女孩

2013-08-09 10:03 225 查看
HANA已经快三岁了,听起来像是一个女孩的名字,但是它的全称是SAP High
performanceAnalytic Appliance(SAP高性能分析设备),内存数据库的一种。参与这个征文活动希望给新手提供一些帮助,下面谈谈自己对HANA的认识,不当之处请诸位多多指出。
   
数据可以说是当今时代的新油田,大量的数据给企业发展带来未能估量的利益。在大数据时代不仅仅大型企业、跨国企业才会产生大量数据,即使在中小型企业里也会产生TB级的数据量,没有大数据的企业是悲哀的,这个时代没有大数据的企业还能生存的也只能是某国的垄断国有企业等。HANA的出现是数据库发展的质变标志,传统的数据库中磁盘读取速度严重制约了系统的性能,大量的数据无法在应用层进行实时快速展现,这一瓶颈无法有效的解决,是由于磁盘的机械特性决定的。在大数据到来的时代解决这一问题,这便成了当务之急。内存数据库的诞生正是有效解决这一问题的方案。随着CPU多核技术的提高,物理内存性能的提高,以及硬件价格的相对下降(随着技术进步用同样的钱买来的内存越来越大,CPU核心越来越多、主频越来越高,根据摩尔定律),故HANA是软硬结合的分析设备。

下面就HANA的特点做一些介绍

特性一:内存存储,并发处理;使用内存存储大大提高了数据存储的速度,可以使原本需要一天的工作在短短几十秒内完成,HANA是基于主内存的并发处理,充分的利用多核CPU的特点,可以高效利用CPU的每一个核心。

特性二:支持行存储与列存储,行存储作为传统数据库的存储模式相信大家不会陌生,列式数据存储相对行存储的优势在于采用优化后的的数据上载到中央处理器,以及高效的数据压缩的能力和快速的数据聚合的能力;比如A物料号=410001,B数量=N,目前有三个订单
行存为:A=410001 B=1,  A=410001 B=2,A=410001 B=3,;列存为:A=410001(标记3个) B=1,B=2,B=3   ;列式数据存储也可以与行式数据存储的表进行关联。

特性三:列存储压缩性能,相对于传统数据硬盘存储,在HANA中大致压缩比为5:1,也就是说以前占用500G的数据在HANA中用100G空间就可以搞定,但是HANA确实不便宜,服务器必须是SAP认证过的才可以进行实施。

特性四:可分区,如果有一张超大的表,超出了HANA的处理范围,那么就需要把表拆开,或者进行分区,HANA可以有效进行分区,分布处理这张表,这一点表现了HANA对超大数据的处理能力。

特性五:不需要汇总表,由于HANA列存储的优势,本身就相当于一个大的汇总表,所以不需要汇总表,也可以理解为无汇总表。你要实时性就的减少汇总时间,为保证实时所以不需要汇总表。

特性六:仅增量插入, 在列存储写数据的时候,为保证实时性能,当大量插入数据时,这些数据会插入到SDD(固态硬盘)里(HANA服务器上有RAM、SDD、HDD,用途分别为主存储,日志存储,备份存储),当达到一个size的时候开始执行合并。

特性七:MPP,内存本地化:把大数据量和计算量分散到不同处理器并行处理:不同的服务器之间也共享同一组数据,容灾性:单一的服务器的DOWN机将不影响任何计算。

下面看看HANA样子  HANAserver要安装在 Linux 环境下
现在使用的是SUSELinux

 

这张图是win7 HANA Studio 进去的界面


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐