(一)、认识 hadoop
2016-01-20 10:36
453 查看
hadoop不是一个英文单词, 是作者(Doug Cutiing)发明的词, hadoop名称来源作者小孩的一个絨毛填充黄色大象玩具. 它的发音是:[hædu:p] – 嗨都泼
对于 hadoop 2.0 来说, 它的核心有三部分: HDFS、MapReduce 和 YARN, 其中 YARN 是 2.0 新加的, 它是为了解决 MapReduce 的缺陷, 有了它, hadoop 就可以很好的兼容 storm、spark等等框架.
理解下相关的关键字含义:
HDFS: 简单的理解成一种文件格式, 类似 FAT32、NTFS 这种.
MapReduce: 离线计算模型.
YARN: 资源协调者.
Storm: 流式计算模型.
Spark: 内存计算模型.
Hive: 数据仓库工具, 它是为了简化编写 MapReduce.
HBse: 一种分布式、面向列的开源数据库, 可以很好的使用在 HDFS 上.
对于 hadoop 2.0 来说, 它的核心有三部分: HDFS、MapReduce 和 YARN, 其中 YARN 是 2.0 新加的, 它是为了解决 MapReduce 的缺陷, 有了它, hadoop 就可以很好的兼容 storm、spark等等框架.
理解下相关的关键字含义:
HDFS: 简单的理解成一种文件格式, 类似 FAT32、NTFS 这种.
MapReduce: 离线计算模型.
YARN: 资源协调者.
Storm: 流式计算模型.
Spark: 内存计算模型.
Hive: 数据仓库工具, 它是为了简化编写 MapReduce.
HBse: 一种分布式、面向列的开源数据库, 可以很好的使用在 HDFS 上.
相关文章推荐
- 使用System.arraycopy()实现数组之间的复制
- linux select 多路复用机制
- md5解密网站大全
- Opencv学习笔记(六)SURF学习笔记
- linux下socket connect超时设置
- nginx日志分析
- Linux PCI网卡驱动的详细分析
- linux中top命令详解
- system.map uboot.map vmlinux的区别
- linux下vi命令大全
- linux上使用eCryptFS加密文件夹的方法
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- Linux to read the Processor model, physical cores, virtual cores and L1, L2 cache
- CentOS 7安装启动vsftpd服务
- nginx与openssl的整合
- centos6.5配置本地yum源