hadoop使用场景
2016-03-29 13:55
337 查看
大数据量存储:分布式存储
日志处理: Hadoop擅长这个
海量计算: 并行计算
ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
机器学习: 比如Apache Mahout项目
搜索引擎:hadoop + lucene实现
数据挖掘:目前比较流行的广告推荐
大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
数据不进行本地缓存(文件很大,且顺序读没有局部性)
任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
用户细分特征建模
个性化广告推荐
智能仪器推荐
转自:http://www.aboutyun.com/thread-5726-1-1.html
日志处理: Hadoop擅长这个
海量计算: 并行计算
ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
机器学习: 比如Apache Mahout项目
搜索引擎:hadoop + lucene实现
数据挖掘:目前比较流行的广告推荐
大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
数据不进行本地缓存(文件很大,且顺序读没有局部性)
任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
用户细分特征建模
个性化广告推荐
智能仪器推荐
转自:http://www.aboutyun.com/thread-5726-1-1.html
相关文章推荐
- 学习osv原理需要操作系统启动流程
- 学习嵌入式linux开发板之iTOP-4412 开发板如何操作GPIO
- 2016-3-29 linux基础学习——vim编辑器的使用
- Linux内核分析 读书笔记 (第十八章)
- ajax获取其他网站接口信息
- 关于linux mmc/sd驱动程序架构
- 使用信号量控制Linux线程同步
- 应用架构谈 开篇(转载)
- arm-linux-gcc的配置
- 运维标准化工作流程
- docker常用命令
- tomcat 的基本概念和安装配置
- CentOS6.5配置网易163做yum源
- Redhat hadoop2.7.2安装笔记
- hadoop生态系统学习之路(四)MR支持的输入文件格式以及输出文件格式
- /bin/bash: jar: command not found
- [整理]Centos6.5 + hadoop2.6.4环境搭建
- Docker安装
- VK Cup 2016 - Round 1 (Div. 2 Edition)-B - Bear and Displayed Friends-STL(维护前k大)
- linux下删除空行的几种方法