您的位置:首页 > 运维架构

hadoop的dfs.replication和备份数问题

2016-05-21 00:00 429 查看
修改master的dfs.replication

vim etc/hadoop/hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

可以通过命令来更改已经上传的文件的副本数:
hadoop fs -setrep -R 3 / (指定需要修改备份的路径)

查看当前hdfs的副本数 hadoop fsck -locations

Total size: 3535 B
Total dirs: 1
Total files: 3
Total symlinks: 0
Total blocks (validated): 3 (avg. block size 1178 B)
Minimally replicated blocks: 3 (100.0 %)
Over-replicated blocks: 0 (0.0 %)
Under-replicated blocks: 0 (0.0 %)
Mis-replicated blocks: 0 (0.0 %)
Default replication factor: 2
Average block replication: 2.0
Corrupt blocks: 0
Missing replicas: 0 (0.0 %)
Number of data-nodes: 2
Number of racks: 1
FSCK ended at Sat May 21 09:49:27 CST 2016 in 9 milliseconds

The filesystem under path '/' is HEALTHY

如果你只有3个datanode,但是你却指定副本数为4,是不会生效的,因为每个datanode上只能存放一个副本。

一个文件,上传到hdfs上时指定的是几个副本就是几个。以后你修改了副本数,对已经上传了的文件也不会起作用。可以再上传文件的同时指定创建的副本数
Hadoop dfs -D dfs.replication=1 -put 70M logs/2
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: