您的位置:首页 > 运维架构

Hadoop新旧集群迁移

2016-04-28 14:05 369 查看
Hive数据仓库迁移

hadoop distcp hftp://bdc220.hexun.com:50070/dw /
建hive映射表即可

HBase迁移
hadoop distcp hftp://bdc220.hexun.com:50070/hbase /
HBase表结构考备后直接可用

distcp 命令集群数据考备

参数一: 源集群(旧)

参数二: 目标集群(新)

如出现异常:

Caused by: java.io.IOException: Check-sum mismatch between 

解决方法:

hdfs-site.xml将dfs.checksum.type属性设置为CRC32

<property>

<name>dfs.checksum.type</name>

<value>CRC32</value>

</property>

hadoop distcp -update -skipcrccheck hftp://X.X.X.X:50070/user/dd_edw/warehouse/X/dt=2014-04-10 /user/impala/warehouse/1
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: