您的位置：首页 > 运维架构

关于Hadoop中5个主要的守护进程的作用

2012-01-14 16:12 344 查看

一般如果正常启动hadoop，我们可以在master上通过jps命令看到以下5个daemons:

[root@master ~]# jps

19803 SecondaryNameNode

19994 TaskTracker

31144 Jps

19571 NameNode

19672 DataNode

19887 JobTracker

下面依次介绍这些进程：

1. NameNode

它是Hadoop 中的主服务器，管理文件系统名称空间和对集群中存储的文件的访问。

参考资料：

http://blog.csdn.net/ae86_fc/article/details/5842020

http://blog.netoearth.com/html/201009/hadoop-namenode-ha%E6%96%B9%E6%A1%88.htm

http://www.tech126.com/hadoop-namenode/

2. SecondaryNameNode

它不是 namenode 的冗余守护进程，而是提供周期检查点和清理任务。

出于对可扩展性和容错性等考虑，我们一般将SecondaryNameNode运行在一台非NameNode的机器上。

参考资料：

/article/8161356.html

http://blog.csdn.net/AE86_FC/article/details/5284181

3. DataNode

它负责管理连接到节点的存储（一个集群中可以有多个节点）。每个存储数据的节点运行一个 datanode 守护进程。

4. JobTracker和TaskTracker

JobTracker负责调度 DataNode上的工作。每个 DataNode有一个TaskTracker，它们执行实际工作。

JobTracker和 TaskTracker采用主-从形式，JobTracker跨DataNode分发工作，而
TaskTracker执行任务。

JobTracker还检查请求的工作，如果一个 DataNode由于某种原因失败，JobTracker会重新调度以前的任务。

其他资料：

http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/

http://www.ibm.com/developerworks/cn/linux/l-hadoop-2/

http://www.ibm.com/developerworks/cn/linux/l-hadoop-3/

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航