Hadoop学习(2):HDFS基础
2016-07-26 23:52
288 查看
释义
HDFS是一个文件管理系统,用于分布式存储“大数据”。意义
通俗的说,就好比我们平常用网银,当我们有一张建行的卡,我们上淘宝买东西直接用网银支付就行了,假定一张卡只能存1万。但是当我们有好多钱的时候,一张卡显然不太够用,我们需要更多的卡或者说更高级的卡,但是卡多了有不便于管理,高级的卡又太贵了,怎么办了。这个时候我们就可以用类似支付宝的管理工具去管理我们的银行卡,我们可以在支付宝里面绑定多张银行卡,付钱的时候我们只需要输入支付密码就行了,而不用去想用哪张卡。这里的钱就相当于是数据,卡就是硬盘,支付宝就成了HDFS。当数据量非常大的时候,为了节省成本,我们可以不用去购买昂贵的高端机器(VIP卡),直接使用普通的pc机就可以,数据之间的关联什么的都是HDFS来帮我们处理。
基本概念
数据块(block)
一个数据块就好比一个硬盘上的一个分区,默认最基本的存储单位是64M的数据块,也就是说一个“分区”64M元数据节点(NameNode):
数据节点(DataNode):
存储数据块ID和数据块内容,以及他们的映射关系交互方式
心跳检测主从架构系统(Master/Slave)
一个HDFS集群包含一个单独的Master节点和多个Slave节点服务器,这里的一个一个单独的Master节点的含义是HDFS系统中只存在一个逻辑上的Master组件冗余存储机制
多个备份相关文章推荐
- 详解HDFS Short Circuit Local Reads
- Hadoop_2.1.0 MapReduce序列图
- 使用Hadoop搭建现代电信企业架构
- 单机版搭建Hadoop环境图文教程详解
- 康诺云推出三款智能硬件产品,为健康管理业务搭建数据池
- MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程
- hadoop常见错误以及处理方法详解
- hadoop 单机安装配置教程
- hadoop的hdfs文件操作实现上传文件到hdfs
- hadoop实现grep示例分享
- php+ajax导入大数据时产生的问题处理
- C# 大数据导出word的假死报错的处理方法
- Apache Hadoop版本详解
- linux下搭建hadoop环境步骤分享
- java连接hdfs ha和调用mapreduce jar示例
- java实现将ftp和http的文件直接传送到hdfs
- hadoop client与datanode的通信协议分析
- hadoop中一些常用的命令介绍
- Hadoop单机版和全分布式(集群)安装