您的位置:首页 > 运维架构

零基础学习 Hadoop 该如何下手?

2016-04-22 22:32 405 查看
作者:Han Hsiao

链接:https://www.zhihu.com/question/19795366/answer/24524910

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

推荐一些Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

一、学习路线图
Hadoop家族学习路线图 开篇必读

Hive学习路线图

Mahout学习路线图

二、编程实践
Hadoop历史版本安装

用Maven构建Hadoop项目

Hadoop编程调用HDFS

用Maven构建Mahout项目

Mahout推荐算法API详解

用MapReduce实现矩阵乘法

从源代码剖析Mahout推荐引擎

Mahout分步式程序开发 基于物品的协同过滤ItemCF

Mahout分步式程序开发 聚类Kmeans

PageRank算法并行实现

三、案例分析
海量Web日志分析 用Hadoop提取KPI统计指标

用Hadoop构建电影推荐系统

用Mahout构建职位推荐引擎

Mahout构建图书推荐系统

PeopleRank从社交网络中发现个体价值

作者:董飞

链接:https://www.zhihu.com/question/19795366/answer/29611539

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

本人前两年收集的资料
Paper
Starfish: A Self-tuning System for Big Data Analytics
MapReduce Online
Hive --- Stanford University

Lecture
cloudera lectures

Research Project
Starfish --- Duke University
Hadoop Online Prototype -- Berkeley
Phoenix -- Stanford
Projects/Monitoring Hadoop through Tracing --- Berkeley
HadoopDB --- Yale University
Hadoop@Brown --- Brown University
Hadoop@UMD --- University of Maryland (Jimmy Lin)
Hadoop++ --- Saarland University
Haloop --- UCI

Industry/Open Source
Hadoop --- Apache
MapReduce NextGen aka YARN aka MRv2 --- Apache
Pig --- Apache
Hive --- Apache
HCatalog --- Apache
Mesos --- Apache
Cascading --- Concurrent
SNA --- LinkedIn
Storm --- Twitter
S4 --- Yahoo
Oozie --- Yahoo

Industry/Startup
Cloudera
Greenplum
Hortonworks
Teradata
MapR
Datameer
Karmasphere
Datatax
Acunu
Asterdata
HAdapt
HStreaming
CloudScale

Conference
Hadoop World
HBaseCon
Hadoop Summit

Tutorial
Hadoop for beginners --- Yahoo!

作者:卡索

链接:https://www.zhihu.com/question/19795366/answer/18493097

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

"Hadoop.Operations.pdf.zip"http://vdisk.weibo.com/s/vDOQs6xMAQH62

2."Hadoop权威指南(中文版)(带书签).pdf"Hadoop权威指南(中文版)(带书签).pdf

3."[Hadoop权威指南(第2版)].pdf"[Hadoop权威指南(第2版)].pdf

4."hadoop权威指南第3版2012.rar"hadoop权威指南第3版2012.rar

5.《Hadoop技术内幕:深入解析HadoopCommon和HDFS.pdf"《Hadoop技术内幕:深入解析Hadoop Common和HDFS.pdf

6."Hadoop技术内幕:深入解析MapReduce架构设计与实现原理.pdf"Hadoop技术内幕:深入解析MapReduce架构设计与实现原理.pdf

7."Hadoop实战.pdf"Hadoop实战.pdf

8."Hadoop实战-陆嘉恒(高清完整版).pdf"Hadoop实战-陆嘉恒(高清完整版).pdf

9."Hadoop实战(第2版).pdf"Hadoop实战(第2版).pdf

10."HadoopinAction.pdf"Hadoop in Action.pdf

11"Hadoop in practice.pdf"Hadoop in practice.pdf

12"HadoopThe.Definitive.Guide,3Ed.pdf"Hadoop The.Definitive.Guide,3Ed.pdf

13."O'Reilly.Hadoop.The.Definitive.Guide.3rd.Edition.May.2012.pdf"O'Reilly.Hadoop.The.Definitive.Guide.3rd.Edition.May.2012.pdf

14."hadoop入门实战手册.pdf"hadoop入门实战手册.pdf

15."Hadoop入门手册.chm"Hadoop入门手册.chm

16."windows下配置cygwin、hadoop等并运行mapreduce及mapreduce程序讲解.doc"windows下配置cygwin、hadoop等并运行mapreduce及mapreduce程序讲解.doc

17"在Windows上安装Hadoop教程.pdf"在Windows上安装Hadoop教程.pdf

18."Hadoop源代码分析(完整版).pdf"Hadoop源代码分析(完整版).pdf

19."hadoop-api.CHM"hadoop-api.CHM

20."HBase-Hadoop@小米.pptx"
HBase-Hadoop@小米.pptx

21."但彬-Hadoop平台的大数据整合.pdf"但彬-Hadoop平台的大数据整合.pdf

22."QCon2013-罗李-Hadoop在阿里.pdf"QCon2013-罗李

23."百度hadoop计算技术发展.pdf"百度hadoop计算技术发展.pdf

24."QCon-吴威-基于Hadoop的海量数据平台.pdf"QCon-吴威-基于Hadoop的海量数据平台.pdf

25."8步安装好你的hadoop.docx"8步安装好你的hadoop.docx

26."hadoop运维经验分享.ppsx"hadoop运维经验分享.ppsx

27."PPT集萃:20位Hadoop专家分享大数据技术工具与最佳实践.rar"PPT集萃:20位Hadoop专家分享大数据技术工具与最佳实践.rar

28."Hadoop2.0基本架构和发展趋势.pdf"Hadoop 2.0基本架构和发展趋势.pdf

29."Hadoop与大数据技术大会PPT资料.rar"Hadoop与大数据技术大会PPT资料.rar

30."Hadoop2011云计算大会.rar"Hadoop2011云计算大会.rar

31."hadoop开发者(1~3)期.zip"hadoop开发者.zip
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hadoop