您的位置:首页 > 运维架构

Hadoop学习笔记(1)——初识Hadoop

2014-11-07 16:38 323 查看
1.Hadoop是什么?

      Hadoop是一个分布式系统基础架构,架构最核心的设计就是:分布式文件系统(简称HDFS)和MapReduce。HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。

2.Hadoop的优势?

·Hadoop能够对大量数据进行分布式处理( PB 级数据)。

·HDFS有高容错性的特点,设计用来部署在低廉的硬件上,使得Hadoop更加可靠。

3.工作平台?

      Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台(我使用Ubuntu14)上是非常理想的。使用linux
PC机组建集群。简而言之就是将大量数据文件分成块(block),分布在集群的机器上,使用linux的文件系统存放,同时每块文件至少有3份以上的冗余。

4.现状?

国外:Facebook、Twitter、雅虎等

国内:阿里巴巴、百度、京东等

  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: