您的位置:首页 > 其它

Hbase-简介-小结

2017-12-19 11:06 239 查看
大数据时代的数据非常重要,都具有价值

Hbase是一个分布式的、面向列的开源数据库。技术思想来源‘BigTable’论文,不同一般RDBMS适合非结构化数据存储的数据库,基于列。

为什么需要Hbase?

关系数据库系统已无法适应大型分布式数据存储的需要

改良的关系数据库(副本、分区等)难于安装和维护

关系模型对数据的操作使数据的存储变得复杂

Hbase在设立之初就为扩展做好了充分准备(加入存储节点),使用表的概念

Hbase是架构在Hadoop上的,hbase可以单独使用(只做存储),也可以与Hadoop无缝集成(存放在Hbase的数据可直接通过Hadoop分析),分析结果直接写入Hbase

HDFS是一个存储空间

Hbase是一个内存数据库,Hbase中的表,索引等是存在HDFS之上的(所有数据文件都存在HDFS上)

应用场景

大数据量且快速随机访问

数据容量横向扩展

业务场景简单,不需要关系数据库中的很多特性(事务、连接)

需高吞吐量

存结构化和半结构化、非结构化数据

Hbase的问题

不支持二级索引

服务是单点的,单台机器宕机后在master恢复它期间它所负责的部分数据将无法恢复

运维上没有关系数据库,成熟,稳定
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hbase