您的位置:首页 > 运维架构

Hbase总结(二)--Hbase查询过滤器简介

2017-03-09 00:00 176 查看
Hbase过滤器提供了非常强大的特性来帮助用户提高处理表中的数据的效率,Hbase过滤器的作用是在查询中添加更多的限制条件来减少查询得到的数据量。值得注意是的是Hbase的所有过滤器都是在服务器段生效的,这样可以保证被过滤掉的数据不会被传送到客户端,所以过滤器只能用来筛选掉无用的数据,不能用来查询用户指定用户需要哪些信息。我们自己在Hbase客户端实现的过滤功能,不会减小服务端传送到客户端的数据量(可能会影响系统性能)。Hbase的Filter执行过程,入下图



1. hbase的过滤器分类如下:

行过滤器查询速度使用场景过滤器的实现
行过滤器最好基于行键来过滤数据的场景单个条件过滤行
列族过滤器--通过比较列族来返回结果,需要组合使用只对单个列族起作用
值过滤器--筛选某个特定值的单元格可以使用功能强大的表达式来筛选
参考列过滤器--不仅可以通过指定的信息筛选数据,还能通过指定一个参考列或者引用列,并通过参考列来控制其他列的过滤多行多列
专用过滤器--特定场景下使用--
2.hbase是的行键值具有索引的,所以使用和行键进行过滤时,性能会比较高。常用的行键过滤器有RowFileter(单个行键的查询),PreFixFilter(多行键的查询)

3.hbase的查询框架推荐使用spring-data-hadoop hbase框架,该框架已经对hbase的查询操作做了一些很好的封装,配置也比较方便。详细的使用方法将会在Hbase的过滤器(三)--spring-data-hadoop hbase框架中介绍使用方法
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  HBase Hadoop