Hadoop能做什么?
2015-12-18 19:55
239 查看
大数据时代已经到来,金融数据、电商数据、社交数据、游戏数据…….这些数据的规模、结构、增长的速度都给传统数据存储和处理技术带来巨大考验。Hadoop的简单方便、可扩展性和健壮性让其在大数据处理方面占尽优势,其主要适合的应用场景有:
1) 搜索引擎,Doug Cutting设计Hadoop的初衷,就是为了针对大规模的网页快速建立索引。
2) 大数据存储,利用Hadoop的分布式存储能力,例如数据备份、数据仓库等。
3) 大数据处理,利用Hadoop的分布式处理能力,例如数据挖掘、数据分析等。
4) 科学研究,Hadoop是一种分布式的开源框架,对于分布式计算有很大程度地参考价值。
目前,Hadoop已经成长为一个庞大的体系,只要和海量数据相关的领域,都有Hadoop的身影。
预计到2020年,每年产生的数字信息中将会有1/3的内容驻留在云平台中或借助云平台处理。我们需要对这些数据进行分析处理,以获取更多有价值的信息。那么我们如何高效地存储管理这些数据、如何分析这些数据呢?这时可以选用Hadoop系统。
1) 搜索引擎,Doug Cutting设计Hadoop的初衷,就是为了针对大规模的网页快速建立索引。
2) 大数据存储,利用Hadoop的分布式存储能力,例如数据备份、数据仓库等。
3) 大数据处理,利用Hadoop的分布式处理能力,例如数据挖掘、数据分析等。
4) 科学研究,Hadoop是一种分布式的开源框架,对于分布式计算有很大程度地参考价值。
目前,Hadoop已经成长为一个庞大的体系,只要和海量数据相关的领域,都有Hadoop的身影。
预计到2020年,每年产生的数字信息中将会有1/3的内容驻留在云平台中或借助云平台处理。我们需要对这些数据进行分析处理,以获取更多有价值的信息。那么我们如何高效地存储管理这些数据、如何分析这些数据呢?这时可以选用Hadoop系统。
相关文章推荐
- 关于网站页面重复的问题
- Hadoop 是什么?
- linux指令-新人累积
- 源码安装nginx
- linux内核3.4基于wakeup_source的autosleep机制分析
- linux内核3.4基于wakeup_source的autosleep机制分析
- linux命令学习(1)
- 一个较好的资料收编网站
- Deep Learning in a Nutshell: History and Training
- Mininet加强版——DOT(分布式OpenFlow试验平台)
- 第三方支付架构设计之―帐户体系
- SELinux policy问题解决思路总结
- centos下pg_dump的服务器版本不匹配问题
- sqoop导入数据地图-reduce job分析
- nginx与zookeeper交互,同步数据,发送系统负载信息。
- 解决apache+tomcatserver环境中文乱码的问题
- Shell 字符串比较
- 检测linux服务器性能常用命令
- nginx fastcgi_param导致页面空白
- 韦东山第三期视频监控wpa_supplicant编译出错问题