第3章 认识HDFS习题
2016-09-13 00:54
141 查看
1.选择题
(1)在默认情况下,HDFS块的大小为(128MB)(2)在大多数情况下,副本系数是3,HDFS的存放策略将第二个副本放在(不同机架的节点上)
(3)假设设置的副本数(即参宿dfs.replication)是3,现在系统中有5个副本,那么系统会删除(2)个副本。
(4)在配置文件hdfs-default.xml中定义副本率为(1)时,HDFS将永远处于安全模式。
(5)下列(B)不属于NameNode的功能。A.提供名称查询服务B.保存Block信息,汇报Block信息C.保存metadata信息D.metadata信息在启动后会加载到内存
2.问答题
(1)HDFS和传统的分布式文件系统相比较,有哪些独特的特性?
高容错性、可扩展性、可配置性强文件权限和授权
机架感知功能
安全模式
负载均衡Load Balance(LB)
(2)为什么HDFS的块如此之大?
HDFS的块比磁盘块要大,目的是减小寻址开销。通过这个足够大的块,从磁盘一次读取数据的时间将远远大于定位于这个块开始端所消耗的时间。因此,传送一个由多块组成的文件的时间取决于磁盘传输速度。如果块太小,那么大量的时间将花在磁盘块的定位上。(3)HDFS中数据副本的存放策略是什么?
HDFS默认副本系数是3,第一块放在本机的HDFS目录下;第二块放在不同Rack的某个DataNode上;第三块放在本机同机架的某台机器上。(4)负载均衡作为一个独立的进程与NameNode分开执行,HDFS负载均衡的处理步骤是什么?
NN会搜集到所有DN的磁盘信息;启动进程Rebalancing Server;
移动数据到目标机器上,同时删除自己机器上的数据。
(5)NameNode和DataNode的功能分别是什么?
NN的主要功能:NN提供名称查询功能,它是一个Jetty服务器;
NN保存metadata信息。包括:文件owership和permissions;文件包含哪些块;
Block保存在哪个DN(由DN启动时上报);NN的metadata信息在启动后加载到内存。
DN的主要功能:
保存Block,每个块对应一个元数据的数据信息文件。这个文件主要描述这个块属于哪个文件、第几个块等信息。
启动DN线程时会向NN汇报Block信息。
通过向NN发送心跳保持与其联系(3秒一次),如果NN10分钟没有收到DN的心跳,则认为其已经lost,并将其上的Block复制到其他DataNode上。
相关文章推荐
- C++ Primer 第3章 标准库类型习题+答案
- 《python编程从入门到实践》 第3章习题选做
- 《C++编程思想》(第二版)第3章 C++中的C(笔记、习题及答案)(二)
- HDFS的认识和理解
- 第3章 栈和队列综合习题(leetcode+vjudge)
- [物理学与PDEs]第3章习题6 Lagrange 坐标下的一维理想磁流体力学方程组的数学结构
- 栈和队列-第3章-《数据结构题集》习题解析-严蔚敏吴伟民版
- [物理学与PDEs]第3章习题7 快、慢及Alfv\'en 特征速度的比较
- 学习Opencv第3章课后习题
- 《Python核心编程》第3章 习题
- Learning Perl 第3章习题答案
- 算法导论第3章习题解析
- C++primer习题--第3章
- [物理学与PDEs]第3章习题参考解答
- 《C++编程思想》(第二版)第3章 C++中的C(笔记、习题及答案)(一)
- Welcome to JAVA!(第3章课后习题)
- Hadoop基础教程-第3章 HDFS:分布式文件系统(3.2 HDFS文件读写)
- Hadoop基础教程-第3章 HDFS:分布式文件系统(3.1 HDFS概述)
- Introdution to 3D Game Programming With DirectX11 第3章 习题解答
- C primer plus第3章(数据和C)习题