hadoop 学习笔记(hadoop架构)
2015-07-15 15:53
561 查看
如下图所示:
client —用户
switch—交换机
rack—机架
namenode—名称节点,是hdfs(分布式文件系统)的守护程序,起到一个总控制的作用,记录文件是如何分割成数据块以及这些数据块是存在哪些节点上的。对内存和io进行集中管理,它是一个单点,所以一旦namenode崩溃,整个hadoop将崩溃。用户是先通过访问namenode,来明确文件所在的数据节点位置。(核心的功能)
secondlynamenode—辅助名称节点,是namenode的后备,namenode会与其进行通讯,将文件信息备份到secondlynamenode上,减少namenode的压力,但必须手动修补集群崩溃的问题,所以namenode还是单点形式的。
datanode—负责文件的具体读写,数据的存放。
jobtracker—处理用户提交的作业、将作业切割成若干个task(程序)分配到datanode(数据)里。重启失败的task,释放空间。与namenode相同,在一个集群里也只有一个。
tasktacker—任务跟踪器,与datanode结合(程序+数据),管理各自节点的tasktacker,每个节点只有一个tasktacker但可以执行多个jvm用于执行mapreduce任务。它会与jobtacker交互。
master—运行namenode、secondlynamenode、jobtacker的机器,一般会namenode、jobtacker一台机器,secondlynamenode一台机器。
slave—运行tasktacker、datanode。
client —用户
switch—交换机
rack—机架
namenode—名称节点,是hdfs(分布式文件系统)的守护程序,起到一个总控制的作用,记录文件是如何分割成数据块以及这些数据块是存在哪些节点上的。对内存和io进行集中管理,它是一个单点,所以一旦namenode崩溃,整个hadoop将崩溃。用户是先通过访问namenode,来明确文件所在的数据节点位置。(核心的功能)
secondlynamenode—辅助名称节点,是namenode的后备,namenode会与其进行通讯,将文件信息备份到secondlynamenode上,减少namenode的压力,但必须手动修补集群崩溃的问题,所以namenode还是单点形式的。
datanode—负责文件的具体读写,数据的存放。
jobtracker—处理用户提交的作业、将作业切割成若干个task(程序)分配到datanode(数据)里。重启失败的task,释放空间。与namenode相同,在一个集群里也只有一个。
tasktacker—任务跟踪器,与datanode结合(程序+数据),管理各自节点的tasktacker,每个节点只有一个tasktacker但可以执行多个jvm用于执行mapreduce任务。它会与jobtacker交互。
master—运行namenode、secondlynamenode、jobtacker的机器,一般会namenode、jobtacker一台机器,secondlynamenode一台机器。
slave—运行tasktacker、datanode。
相关文章推荐
- 如何检测网站死链接?
- js前端学习网站
- Linux下基于tty架构的串口驱动分析(S3C2440)
- 网站性能优化:动态缩略图技术实现思路
- 在 SharePoint 2013 中还原已删除的网站集
- 大型网站架构体系的演变
- CPU主板架构
- 学习JAVA多线程的网站
- 架构师之路---IoC框架
- 视频网站如何让用户形成使用订阅的习惯
- 使用脚本命令监控网站日志
- 11个超棒的iOS开发学习网站
- 安全系列------动态网站与静态网站的区别
- 网站不收录可能是受同服务器上的挂马站牵连
- 三层架构摘要
- 网站运营中的问题
- CoreAnimation编程指南(二)渲染架构
- 如何提升网站排名?
- 从外网站点获取的html去除换行回车制表位\n\r\t
- web服务端的架构演变