您的位置:首页 > 运维架构

<hadoop学习历程>--笔记心得3-HDFS数据管理与容错

2016-09-08 10:07 323 查看
一:数据容错



数据在一台机架内存放两个数据块,另外一个机架存放复制的一份,这样保证了

(1)同一个机架内数据损坏一个,也可以就近根据同一个机架内取得数据,

(2)整个机架损坏一个,也可以由另外的一个机架取的数据

二:心跳检测



数据存储到机架内后,如何知道数据块有那些损坏了呢?

我们可以定时任务,定时扫描机架内的数据,看看哪些数据块损坏,然后报告给NameNode管家,管家在更改存放文件与数据块的映射表 和数据块与数据节点的映射表这样保证所有数据都是即时有效的。



总统死掉了,副总统要被选举为总统,这样保证了管家一直正常。hadoop现在是单节点的NameNode,管家死掉了,相当于书本没有了目录,数据就全部丢失了,所以为了保证数据安全,添加了SecondaryNameNode,副管家。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: