您的位置:首页 > 大数据 > Hadoop

Hdfs增量导入小文件合并的思路

2015-12-19 18:01 316 查看
1.使用mr进行合并

2.使用getmerge 将文件拉取到本地,再上传到hdfs,注意nl参数

3.使用appendToFile

4.使用hadoop提供的打包压缩技术

Usage: hadoop fs [generic options]

[-appendToFile … ]

[-getmerge [-nl] ]

hdfs dfs -getmerge -nl /user/hive/warehouse/achi/20* /data/t1.txt
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: