《HBase权威指南》读书笔记9:第九章 高级用法
2015-10-28 17:38
190 查看
行键设计
高表与宽表
高表:表中列少行多宽表:表中列多行少
Hbase只能按行分片,因此高表更有优势。把需要检索的条件尽量放到行键rowkey里面去宽表适合需要行级原子性的需求
辅助索引
由客户端管理索引:缺点比优点更多带索引的事务型Hbase: ITHbase (个人认为要远离在原本就不成熟的HBase上的更不成熟的封装)
带索引的Hbase: IHbase (个人认为要远离在原本就不成熟的HBase上的更不成熟的封装)
协处理器: 用钩子维护索引
搜索集成
用HBase存储数据,用MapReduce任务建立索引,索引使用Lucene 或者 Solr。并且Lucene的后台存储用HBaseBuildTableIndex类可以扫描整个表,并建立Lucene索引,存储在HDFS上
HBasene: 直接在HBase内部建立搜索索引
布隆过滤器
布隆过滤器可以减少 I/O操作的层面,但是消耗很大的性能,默认不要用相关文章推荐
- Facebook's New Real-time Messaging System: HBase to Store 135+ Billion Messages a Month
- Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
- 基于HBase Thrift接口的一些使用问题及相关注意事项的详解
- 如何解决struts2日期类型转换
- hbase shell基础和常用命令详解
- 手把手教你配置Hbase完全分布式环境
- 实战:在Java Web 项目中使用HBase
- HBase RowKey设计的那些事
- HBase基本原理
- HBase中的基本概念
- 【原创】基于分布式存储的开源系统在实时数据库海量历史数据存储项目上的预研
- HBase0.96.x开发使用(一)--安装
- 基于外部ZooKeeper的GlusterFS作为分布式文件系统的完全分布式HBase集群安装指南
- 基于solr实现hbase的二级索引
- 非mapreduce生成Hfile,然后导入hbase当中
- HBase 系统架构
- HBase技术介绍
- 主流NoSQL数据库评测之HBase