ORM-HBASE 一个轻量级映射框架
2016-03-01 15:04
806 查看
背景
HBase在处理billion级别的能力是毫无质疑的,目前优于其他的nosql数据库,如mongodb、cassandra、redis等, 配合它强大的rowkey查询,fileter,协处理器等,在海量数据库中发挥了强大的功能。但是HBase因为满足的是CAP原则中C和P,所以在查询过程中语句支持较弱,使用过程较为复杂。存在下面的一些痛点。痛点
首先HBase只能存储byte数组的数据,数据存入到hbase中时都需要做相应的转换,读取的数据的时候也要相应的转换回来,使用麻烦。第二,HBase在使用过程中,涉及到filter、协处理的使用,如果对API不熟悉,无法下手。
第三,hbase本身不提供分页的功能,每次分页需要在代码中记录当前读取的rowkey,在使用PageFilter读取一定数量的rowkey,然后继续读取,编程复杂度高。
最后,不熟悉hbase的开发人员,无法理解nosql、hbase的no schema,期望还是用关系数据库的方式操作hbase。
HBase ORM框架
基于以上的原因,所以我有了想写一个类似于hibernate那种对象关系映射框架(ORM)的想法,像操作对象一样方便的操作HBase数据库,但是它要是轻量级的,无侵入的,只提供CURD、分页、映射功能的一个简单功能。一些特性:
使用注解的方式,将PO(Persistent Object)映射成HBase对应的表
提供CRUD的方法:create\research\update\delete
提供分页查询的功能
提供类似于hibernate中Criteria 风格的操作方式
Demo:
1、在po对象上添加相应的注解:@Table\@RowKey\@Column
@Table(name = "user")</br> public class User { @RowKey private int id; @Column(family = "info") private int userId; @Column(family = "info", name = "user_name1") private String userName; @Column(family = "info") private long age;
2、使用HBaseColumnarClient实例操作PO对象
HBaseColumnarClient client = new HBaseColumnarClient(scanCaching, scanBatch); DataSourceConfig config = new DataSourceConfig("hbase.properties"); HBaseSource source = new HBaseSource(config.getProperties()); client.setHBaseSource(source); //create client.putObject(user); //delete client.deleteObject(user); //query User user = client.findObject(Bytes.toBytes(1), User.class);
3、提供类似于Hibernate Criteria的风格操作hbase
// count the data Filter[] filters = null; long count = Criteria.aggregate(User.class).fromRow(startRow).toRow(endRow) .filters(filters).build().count(client); // sum the column value long sum = Criteria.aggregate(User.class).fromRow(startRow).toRow(endRow) .filters(filters).propertyName("age").build().sum(client); // query by rowKey User queryUser = Criteria.find(User.class).byRowKey(Bytes.toBytes(id)).build().query(client); // query from startRow to endRow List<User> queryList = Criteria.find(User.class).fromRow(startRow).toRow(endRow).build() .queryList(client); // query by page PageBean<User> pageBean = new PageBean<User>() {}; pageBean.setPageSize(10); pageBean.setStartRow(startRow); pageBean.setStopRow(endRow); PageBean<User> queryPage = Criteria.find(User.class).pageBean(pageBean).build().queryPage(client); // delete data byte[] rowKey = Bytes.toBytes(id); Criteria.delete(User.class).byRowKey(rowKey).build().excute(client);
希望大家喜欢这个框架,多提意见
项目地址:https://github.com/zacharyzhanghao/orm-hbase
相关文章推荐
- 解决count distinct多个字段的方法
- 代码: jquery 插件开发(自用插件)
- cron表达式
- MFC 鼠标画线总结
- 子集和问题
- 矩阵:对称矩阵和稀疏矩阵的压缩存储
- MiniDumpWriteDump
- 原来我从前是那么的努力啊 。哈哈哈。
- javascript数据类型学习
- Django 路由
- Android APK反编译详解(附图)
- C++中的Vector的用法
- bananapi之开发板介绍
- crontab
- C语言学习-计算机组成原理
- PHP连接sql server 2005环境配置
- 表的连接查询
- linux查看ssh用户登录日志与操作日志
- nutch1.9 + solr4.72
- java命令模式