您的位置:首页 > 运维架构

基于hbase mapreduce和coprocessor实现hbase二级索引创建与自动维护

2013-05-17 09:54 260 查看
基于hbase mapreduce和coprocessor实现hbase二级索引创建与自动维护

设计思路:

每个索引建立一个索引表(表名由用户自定义相当于oracle中的索引名,)索引表一个列族“IDX”,一个字段“IDX:V”,rowkey有索引列值拼装而成,“IDX:V”由索引行的rowkey拼装而成。

例子:

“Rowkey”:2013-04-014982332782                

“IDX:V”:319999572,320077775,320165209,320077774,319999571,320077773,319999573

另外建立一个表存放表-索引关系,表名为table_index,结构如下:

rowkey,r:cf,r:cl,r:idx,r:tab

Rowkey:由表名和索引名拼装,如aaa_idx_aaa;

R:cf:索引的列族名

R:cl:索引的列名

R:idx:索引表的名称

R:tab:原表名称

提供一个类供用户调用以创建初始化索引表并在该表注册索引自动更新的coprocessor。

类名:IndexBuilder

参数:字符串数据

arg[0]:需要创建索引的表名

arg[1]:需要创建索引的列族名

arg[2]:需要创建索引的列名,复合索引的列名间用逗号分隔,不要带列族名

arg[3]:自定义的索引表名(不要跟现有表名冲突)

arg[4]:是否执行创建索引的mapreduce程序,“true”为执行,“false”为不执行

定义一个coprocessor拦截用户的put、delete操作实现索引的自动更新
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hbase mapreduce copr