您的位置：首页 > 运维架构

Hadoop学习（2）：HDFS基础

2016-07-26 23:52 288 查看

释义

HDFS是一个文件管理系统，用于分布式存储“大数据”。

意义

通俗的说，就好比我们平常用网银，当我们有一张建行的卡，我们上淘宝买东西直接用网银支付就行了，假定一张卡只能存1万。但是当我们有好多钱的时候，一张卡显然不太够用，我们需要更多的卡或者说更高级的卡，但是卡多了有不便于管理，高级的卡又太贵了，怎么办了。这个时候我们就可以用类似支付宝的管理工具去管理我们的银行卡，我们可以在支付宝里面绑定多张银行卡，付钱的时候我们只需要输入支付密码就行了，而不用去想用哪张卡。

这里的钱就相当于是数据，卡就是硬盘，支付宝就成了HDFS。当数据量非常大的时候，为了节省成本，我们可以不用去购买昂贵的高端机器（VIP卡），直接使用普通的pc机就可以，数据之间的关联什么的都是HDFS来帮我们处理。

基本概念

数据块（block）

一个数据块就好比一个硬盘上的一个分区，默认最基本的存储单位是64M的数据块，也就是说一个“分区”64M

元数据节点（NameNode）：

数据节点（DataNode）：

存储数据块ID和数据块内容，以及他们的映射关系

交互方式

心跳检测

主从架构系统（Master/Slave）

一个HDFS集群包含一个单独的Master节点和多个Slave节点服务器，这里的一个一个单独的Master节点的含义是HDFS系统中只存在一个逻辑上的Master组件

冗余存储机制

多个备份

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： hadoop 大数据 HDFS

相关文章推荐

新的分享

章节导航