您的位置:首页 > 运维架构

Hadoop学习(2):HDFS基础

2016-07-26 23:52 288 查看

释义

HDFS是一个文件管理系统,用于分布式存储“大数据”。

意义

通俗的说,就好比我们平常用网银,当我们有一张建行的卡,我们上淘宝买东西直接用网银支付就行了,假定一张卡只能存1万。但是当我们有好多钱的时候,一张卡显然不太够用,我们需要更多的卡或者说更高级的卡,但是卡多了有不便于管理,高级的卡又太贵了,怎么办了。这个时候我们就可以用类似支付宝的管理工具去管理我们的银行卡,我们可以在支付宝里面绑定多张银行卡,付钱的时候我们只需要输入支付密码就行了,而不用去想用哪张卡。

这里的钱就相当于是数据,卡就是硬盘,支付宝就成了HDFS。当数据量非常大的时候,为了节省成本,我们可以不用去购买昂贵的高端机器(VIP卡),直接使用普通的pc机就可以,数据之间的关联什么的都是HDFS来帮我们处理。

基本概念

数据块(block)

一个数据块就好比一个硬盘上的一个分区,默认最基本的存储单位是64M的数据块,也就是说一个“分区”64M

元数据节点(NameNode):

数据节点(DataNode):

存储数据块ID和数据块内容,以及他们的映射关系

交互方式

心跳检测

主从架构系统(Master/Slave)

一个HDFS集群包含一个单独的Master节点和多个Slave节点服务器,这里的一个一个单独的Master节点的含义是HDFS系统中只存在一个逻辑上的Master组件

冗余存储机制

多个备份
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hadoop 大数据 HDFS