[Hive]Hive使用指南五 客户端导出数据
2016-10-25 20:19
453 查看
根据导出的地方不一样,将这些方式分为三种:导出到本地文件系统中
导出到HDFS中
导出到Hive的另一个表中
导出到HDFS中
导出到Hive的另一个表中
1. 导出到本地文件系统中
INSERT OVERWRITE LOCAL DIRECTORY '/home/q/jifeng.si/data/client_behavior' SELECT * FROM client_behavior WHERE dt = '2017-08-16' LIMIT 2000;这条HQL的执行需要启用Mapreduce作业,运行完这条语句之后,将会在本地文件系统
/home/q/jifeng.si/data/client_behavior目录下生成文件名称为
000000_2的文件,这是由Reduce产生的结果,我们可以看看这个文件的内容:
ll /home/q/jifeng.si/data/client_behavior total 536 -rw-r--r-- 1 wirelessdev wirelessdev 546233 Aug 17 19:46 000000_2在Hive0.11.0版本之前,当用户将Hive查询结果输出到文件中时,用户不能指定列的分割符,默认为\x01:
cat /home/q/jifeng.si/data/client_behavior/000000_2 |awk -F"\x01" '{print $1}' | less 2017-08-16 2017-08-16 2017-08-16 2017-08-16 2017-08-16 2017-08-16 2017-08-16 ...在Hive0.11.0版本之后,引入了新特性,用户可以指定列和行的分隔符:
INSERT OVERWRITE LOCAL DIRECTORY '/home/q/jifeng.si/data/client_behavior' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' SELECT * FROM client_behavior WHERE dt = '2017-08-16' LIMIT 2000;查看数据:
cat /home/q/jifeng.si/data/client_behavior/000000_2 | awk -F"\t" '{print $1}' | less 2017-08-16 2017-08-16 2017-08-16 2017-08-16 2017-08-16 ...
2. 导出到HDFS中
导出到HDFS中,与导出到本地文件系统中思路一致,只是少了一个LOCAL关键字:
INSERT OVERWRITE DIRECTORY 'tmp/data_group/test/client_behavior' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' SELECT * FROM client_behavior WHERE dt = '2017-08-16' LIMIT 2000;上面代码将会导出查询数据到HDFS的
tmp/data_group/test/client_behavior目录下。
3. 导出到Hive的另一个表中
导出到Hive中的另一个表中,也是Hive的数据导入方式:INSERT INTO client_behavior_copy SELECT * FROM client_behavior WHERE dt = '2017-08-16' LIMIT 2000;备注
如果想要导入数据到另一个表中,则这个表必须已经创建成功
相关文章推荐
- [Hive]Hive使用指南四 客户端导入数据
- Table 组件使用指南之八:导出Table数据时保持原有数据格式
- HBase 学习之一 <<HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行>>
- 无服务端纯前台导出数据到Excel-JSExcelXML.js 使用指南
- 使用hive重定向导出的数据文件中包含WARN日志记录问题
- 使用sqoop实现关系型数据库、HDFS、Hive之间数据的导入导出
- Sqoop_详细总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
- Sqoop_详细总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
- 使用 sqoop从MySQL增量导出数据到hive
- net控件中数据导到Excel的格式 首先,我们了解一下excel从web页面上导出的原理。当我们把这些数据发送到客户端时,我们想让客户端程序(浏览器)以excel的格式读取它,所以把mime类型设为:application/vnd.ms-excel,当excel读取文件时会以每个cell的格式呈现数据,如果cell没有规定的格式,则excel会以默认的格式去呈现该cell的数据。这样就给我们提供了自定义数据格式的空间,当然我们必须使用excel支持的格式。下面就列出常用的一些格式: 1) 文本
- 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
- hive 使用方法-建表及导入导出数据(一)
- 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
- 使用PLSQL批量导出、导入表的数据(精简版的Oracle客户端亦可)
- Sqoop_具体总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
- 在使用中文名导出数据到excel文件时文件名出现乱码的解决办法
- datagrid数据导出到excel文件给客户端下载的几种方法
- datagrid数据导出到excel文件给客户端下载的几种方法 选择自 yangyifan0 的 Blog
- datagrid数据导出到excel文件给客户端下载的几种方法
- datagrid数据导出到excel文件给客户端下载的几种方法(转)