Hive 视图 索引 动态分区装载数据
2016-12-21 00:36
1371 查看
视图
创建视图create view v_emp AS select t.name, t.age, t.addr from t_emp;
删除视图
drop view if exists v_emp;
索引
创建索引create index t_emp_index
on table t_emp (name)
as ‘org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler’
with deferred rebuild in table t_index;
显示索引
重建索引
alter index t_emp_index on t_emp rebuild;
删除索引
drop index if exists t_emp_index on t_emp ;
普通装载数据(分区需指定)
从文件中装载数据hive>LOAD DATA [LOCAL] INPATH ‘…’ [OVERWRITE] INTO TABLE t_employee [PARTITION (…)];
通过查询表装载数据
hive>INSERT OVERWRITE TABLE t_emp PARTITION (…) SELECT * FROM xxx WHERE xxx
批量插入
hive>FROM t_emp
INSERT OVERWRITE TABLE t_test PARTITION (…) SELECT … WHERE …
INSERT OVERWRITE TABLE t_test PARTITION (…) SELECT … WHERE …
INSERT OVERWRITE TABLE t_test PARTITION (…) SELECT … WHERE …
动态分区装载数据(分区不需指定)
若没有开启动态分区只支持以下写法hive>INSERT OVERWRITE TABLE t_test PARTITION (country=’china’, city=’chengDu’)
SELECT name, age, addr
FROM t_emp
WHERE t_emp.country = ‘china’
AND t_emp.city = ‘chengDu’;
开启动态分区支持
hive>set hive.exec.dynamic.partition=true; // 开启动态分区
hive>set hive.exec.dynamic.partition.mode=nostrict; // 设置为非严格模式
hive>set hive.exec.max.dynamic.partitions.pernode=1000; // 最大动态可分区数
hive> insert overwrite table t_dynamic partition(country, city) select name, age, addr, country, city from t_emp;
数据导出
通过hdfs方式导出到本地
hive> dfs -copyToLocal /user/hive_remote/warehouse/t_dynamic /home/tt;
或
hive> dfs -get /user/hive_remote/warehouse/t_dynamic /home/t_dynamic;
到hdfs
hive> dfs -cp /user/hive_remote/warehouse/t_dynamic /tmp/t_dynamic;
使用DIRECTORY
hive> insert overwrite [local] directory ‘/home/tt2’ select * from t_dynamic;
加local到本地/默认到hdfs
相关文章推荐
- 大数据Hive的案例、参数、动态分区、分桶、视图、索引、运行方式、权限管理、Hive的优化_03_03
- Hive通过动态分区装载数据
- Hive通过动态分区装载数据
- hive从查询中获取数据插入到表或动态分区
- hive按当天日期建立分区表 | 动态往日期分区插入数据
- 016-Hadoop Hive sql语法详解6-job输入输出优化、数据剪裁、减少job数、动态分区
- hive从查询中获取数据插入到表或动态分区
- hive从查询中获取数据插入到表或动态分区
- hive导入CSV数据,使用动态分区重新分区
- hive 分区partition表 创建 数据导入(动态分区插入、静态分区插入、动静态混合插入)
- Hive里的分区、分桶、视图和索引再谈
- 动态分区装载数据
- 数据仓库(八)---hive的性能优化---hive动态分区
- Hive数据仓库--HiveQL视图和索引
- hive从查询中获取数据插入到表或动态分区
- HIVE动态分区插入数据
- hadoop案例(一)--hive--2T数据动态创建分区
- hive从查询中获取数据插入到表或动态分区
- Hive数据仓库--HiveQL视图和索引
- hive从查询中获取数据插入到表或动态分区