hive2.0版本整合hbase1.2.1
2016-05-28 20:51
465 查看
开始在整合hive和hbase的时候老是报错,错误大概就是分两类:
1,code=1.
2,code=2.
在网上找了好多资料,发现原来是hive2.0以下的版本,会出现兼容问题,所以将hive版本更新到2.0就能解决以上问题。
一,首先hbase没有表的情况下,可以在hive的密令行写:
CREATE TABLE hbase_table_1(key int, value string)
STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’
WITH SERDEPROPERTIES (“hbase.columns.mapping” = “info:name”)
TBLPROPERTIES (“hbase.table.name” = “hivetest001”);
hbase.table.name 定义在hbase的table名称
hbase.columns.mapping 定义在hbase的列族
这样就会在hbase里自动建好hivetest001这个表,当hive 中hbase_table_1中有数据插入,关联的hbase中的表hivetest001也会同步数据。
不过先要做个中间表将数据导入,然后才能通过查询中间表,将数据插入关联表。
load data local inpath ‘/home/hadoop/kk.txt’ into table hbasetest001;
INSERT OVERWRITE TABLE hbase_table_1 SELECT * FROM hbasetest001;
二,hbase中已经存在表了,可以使用下面的语法:
其它基本相同。
1,code=1.
2,code=2.
在网上找了好多资料,发现原来是hive2.0以下的版本,会出现兼容问题,所以将hive版本更新到2.0就能解决以上问题。
一,首先hbase没有表的情况下,可以在hive的密令行写:
CREATE TABLE hbase_table_1(key int, value string)
STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’
WITH SERDEPROPERTIES (“hbase.columns.mapping” = “info:name”)
TBLPROPERTIES (“hbase.table.name” = “hivetest001”);
hbase.table.name 定义在hbase的table名称
hbase.columns.mapping 定义在hbase的列族
这样就会在hbase里自动建好hivetest001这个表,当hive 中hbase_table_1中有数据插入,关联的hbase中的表hivetest001也会同步数据。
不过先要做个中间表将数据导入,然后才能通过查询中间表,将数据插入关联表。
load data local inpath ‘/home/hadoop/kk.txt’ into table hbasetest001;
INSERT OVERWRITE TABLE hbase_table_1 SELECT * FROM hbasetest001;
二,hbase中已经存在表了,可以使用下面的语法:
CREATE EXTERNAL TABLE hbase_table_2(key int, value string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = "cf1:val") TBLPROPERTIES("hbase.table.name" = "some_existing_table");
其它基本相同。
相关文章推荐
- 分享Hive的一份胶片资料
- Facebook's New Real-time Messaging System: HBase to Store 135+ Billion Messages a Month
- Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
- 基于HBase Thrift接口的一些使用问题及相关注意事项的详解
- 如何解决struts2日期类型转换
- Eclipse中查看android工程代码出现"android.jar has no source attachment"的解决方案
- 基于Java实现杨辉三角 LeetCode Pascal's Triangle
- hbase shell基础和常用命令详解
- 手把手教你配置Hbase完全分布式环境
- 实战:在Java Web 项目中使用HBase
- HBase RowKey设计的那些事
- Spark中将对象序列化存储到hdfs
- HBase基本原理
- HBase中的基本概念
- 【原创】基于分布式存储的开源系统在实时数据库海量历史数据存储项目上的预研
- 将Hive的默认数据库Derby改为Postgresql
- kettle中对hive操作时需要知道的东西
- Hive安装配置
- HBase0.96.x开发使用(一)--安装