Hive通过动态分区装载数据
2015-10-06 14:14
295 查看
进入hive:
1、创建分区表t12
create table t12(id int,name string) partitioned by (year:int,month:int) row format delimited fields terminated by '\t';
2、装载数据到分区表t12
load data local inpath 'data/t8' into table t12 partition(year=2015,month=8);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=9);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=10);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=11);
t8中的数据如下所示:
1 liubiaoxin
2 chenxiaoqiong
3 zhangsan
4 lisi
5 wangwu
6 zhaoliu
3、创建分区表t13
create table t13(id int,name string) partitioned by (year:int,month:int) row format delimited fields terminated by '\t';
4、动态加载数据到分区表
insert into table t13 partition(year=2015,month) select
id,name,month from t12 where year=2015;
执行此语句会把t12表中的year=2015的所有数据插入到新的分区表t13中。注意id,name,month的写法,t13中有id、name、year、month字段,其中year、month为分区字段,插入的时候,因为已经指定year=2015,所以从t12中查询的时候,只指定三列id,name,month就行了。
5、使用全部分区才可以变为动态的
set hive.exec.dynamic.partition.mode=nonstrict; //必须设置,才可以使用全部分区才可以变为动态的
insert into table t13 partition(year,month) select * from t12;
1、创建分区表t12
create table t12(id int,name string) partitioned by (year:int,month:int) row format delimited fields terminated by '\t';
2、装载数据到分区表t12
load data local inpath 'data/t8' into table t12 partition(year=2015,month=8);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=9);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=10);
load data local inpath 'data/t8' into table t12 partition(year=2015,month=11);
t8中的数据如下所示:
1 liubiaoxin
2 chenxiaoqiong
3 zhangsan
4 lisi
5 wangwu
6 zhaoliu
3、创建分区表t13
create table t13(id int,name string) partitioned by (year:int,month:int) row format delimited fields terminated by '\t';
4、动态加载数据到分区表
insert into table t13 partition(year=2015,month) select
id,name,month from t12 where year=2015;
执行此语句会把t12表中的year=2015的所有数据插入到新的分区表t13中。注意id,name,month的写法,t13中有id、name、year、month字段,其中year、month为分区字段,插入的时候,因为已经指定year=2015,所以从t12中查询的时候,只指定三列id,name,month就行了。
5、使用全部分区才可以变为动态的
set hive.exec.dynamic.partition.mode=nonstrict; //必须设置,才可以使用全部分区才可以变为动态的
insert into table t13 partition(year,month) select * from t12;
相关文章推荐
- 人性的弱点&&影响力
- 清除UIWebView缓存
- mergesort
- 根据图片的网络URL获取Bitmap
- Xcode 7.0过后,也就是iOS9.0过后适配时出现的问题
- 关于#define宏定义
- Android Material Design: NavigationView抽屉导航菜单
- Win10怎么删除或是不显示快速访问中最近使用文件记录?
- CYC-MKMapView用法
- 301/302 http会话跳转
- 图像处理职位面试题汇总(7)
- 我为什么要写《一起学java》这个系列
- POJ 题目1185 炮兵阵地(状压DP)
- turnjs4翻书效果
- Nginx+uWSGI+Django框架搭建
- Thinkphp 模块设置 及应用目录修改
- 我也来谈谈模型思维(一):同群效应
- Keepalived 安装 配置
- 二叉树的先序/中序/后序/层次遍历
- 从30岁到35岁:为你的生命多积累一些厚度【转载】