您的位置:首页 > 大数据

如何进入大数据时代领域,学习路线是什么?

2019-07-01 17:44 302 查看

学习大数据首先要根据自身的知识结构选择学习方向,比如数学和统计学专业的学生可以选择数据分析方向,而计算机专业的学生可以选择大数据开发方向,不同的学习方向需要制定不同的学习计划。

虽然不同的学习方向往往需要学习不同的内容,但是对于零基础的学习者来说,以下三方面基础知识是都需要学习的:

第一:编程语言。目前在大数据领域应用比较广泛的语言包括Java、Python、Scala、R和Go等,其中Java在Hadoop平台应用比较多,而Scala在Spark平台应用比较普遍。

 

第二:大数据平台。学习大数据知识绕不过大数据平台,大数据平台承载了分布式存储和分布式计算的核心任务,所以大数据平台研发也是目前大数据领域的重要岗位。目前Hadoop和Spark是比较适合初学者学习的大数据平台,一方面是其开源的属性,另一方面Hadoop对于硬件的要求也比较低。

第三:算法。大数据技术的核心诉求是数据价值化,而目前数据价值化的主要方式就是数据分析,所以掌握算法不仅对于数据分析岗位非常重要,对于大数据开发岗位也具有现实的意义。可以说,大数据产业链内大量的岗位任务都要围绕算法展开,所以掌握算法是学习大数据技术的核心任务之一。学习算法可以从一些经典的算法开始,比如kNN、决策树、朴素贝叶斯、支持向量机等等。

想要在大数据这个领域汲取养分,让自己壮大成长。分享方向,行动以前先分享下一个大数据交流分享资源群19942加上7210,欢迎想学习,想转行的,进阶中你加入学习。?

 

大数据不是某个专业或一门编程语言,实际上它是一系列技术的组合运用。

有人通过下方的等式给出了大数据的定义。

大数据 = 编程技巧 + 数据结构和算法 + 分析能力 + 数据库技能 + 数学 + 机器学习 + NLP + OS + 密码学 + 并行编程

虽然这个等式看起来很长,需要学习的东西很多,但付出和汇报是成正比的,至少和薪资是成正比的。

既然要学的知识很多,那么一个正确的学习顺序就非常关键了。

实验楼为「大数据」制定了一条专业的学习路径,希望帮助大家少走弯路。主要分为 7 个阶段:入门知识 → Java 基础 → Scala 基础 → Hadoop 技术模块 → Hadoop 项目实战 → Spark 技术模块 → 大数据项目实战。

其中,阶段一到阶段五均为免费课程,具体说来:

阶段一:学习入门知识

这一部分主要针对的是新手,在学习之前需要先掌握基本的数据库知识。MySQL 是一个 DBMS(数据库管理系统),是最流行的关系型数据库管理系统(关系数据库,是建立在关系数据库模型基础上的数据库,借助于集合代数等概念和方法来处理数据库中的数据)。MongoDB 是 IT 行业非常流行的一种非关系型数据库(NoSQL),其灵活的数据存储方式备受当前 IT 从业人员的青睐。而 Redis 是一个开源、支持网络、基于内存、键值对存储数据库。两者都非常有必要了解。

1.Linux 基础入门(新版)

2.Vim编辑器

3.Git 实战教程

4.MySQL 基础课程

5.MongoDB 基础教程

6.Redis基础教程

阶段二:Java基础

Java 是目前使用最为广泛的编程语言,它具有的众多特性,特别适合作为大数据应用的开发语言。

Java 语言具有功能强大和简单易用两个特征,跨平台应用能力比 C、C++ 更易用,更容易上手。同时还具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点。最重要的一点是 Hadoop 是用 Java 编写的。

1.Java编程语言(新版)

2.Java进阶之设计模式

3.J2SE核心开发实战

4.JDK 核心 API

5.JDBC 入门教程

6.Java 8 新特性指南

阶段三:Scala基础

Scala 是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。由于 Scala 运行于 Java 平台(Java 虚拟机),并兼容现有的Java 程序,所以 Scala 可以和大数据相关的基于 JVM 的系统很好的集成。

1.Scala 开发教程

2.Scala 专题教程 - Case Class和模式匹配

3.Scala 专题教程 - 隐式变换和隐式参数

4.Scala 专题教程 - 抽象成员

5.Scala 专题教程 - Extractor

6.Scala 开发二十四点游戏

阶段四:Hadoop技术模块

Hadoop 是一款支持数据密集型分布式应用并以 Apache 2.0 许可协议发布的开源软件框架,它能搭建大型数据仓库,PB 级别数据的存储、处理、分析、统计等业务。编程语言你可以选,但 Hadoop 一定是大数据必学内容。

1.Hadoop入门进阶课程

2.Hadoop部署及管理

3.HBASE 教程

4.Hadoop 分布式文件系统--导入和导出数据

5.使用 Flume 收集数据

阶段五:Hadoop项目实战

当然,学完理论就要进行动手实战了,Hadoop 项目实战可以帮助加深对内容的理解,并锻炼动手能力。

1.Hadoop 图处理--《hadoop应用框架》

阶段六:Spark技术模块

Spark 和 Hadoop 都是大数据框架。Hadoop 提供了 Spark 所没有的功能特性,比如分布式文件系统,而 Spark 为需要它的那些数据集提供了实时内存处理。所以学习 Spark 也非常必要。

1.Spark2.x 快速入门教程

2.Spark 大数据动手实验

3.Spark 基础之 GraphX 图计算框架学习

4.Spark 基础之 DataFrame 基本概念学习

5.Spark 基础之 DataFrame 高阶应用技巧

6.Spark 基础之 Streaming 快速上手

7.Spark 基础之 SQL 快速上手

8.Spark 基础之使用机器学习库 MLlib

9.Spark 基础之 SparkR 快速上手

10.流式实时日志分析系统--《Spark 最佳实践》

11.使用 Spark 和 D3.js 分析航班大数据

阶段七:大数据项目实战

最后阶段提供了大数据实战项目,这是对常用技能的系统运用,例如使用常用的机器学习进行建模、分析和运算,这是成为大数据工程师过程中的重要一步。

1.Ebay 在线拍卖数据分析

2.流式实时日志分析系统--《Spark 最佳实践》

3.大数据带你挖掘打车的秘籍

4.Twitter数据情感分析

5.使用 Spark 进行流量日志分析

6.Spark流式计算电商商品关注度

7.Spark的模式挖掘-FPGrowth算法

对了,我们为新手设计了一个大数据的楼+课程,帮助大家达到大数据研发初级工程师的水平。有兴趣的小伙伴们可以加入我们一起学习

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: