您的位置:首页 > 大数据

大数据主要学什么,学习大数据你要会什么

2018-06-08 23:24 246 查看
版权声明:看到这里啦^_^有意见?评论一下可好^_^对你有用?点个赞可好^_^,欢迎转载,转载请标明出处 https://blog.csdn.net/qq_38314823/article/details/80628981

- 学习大数据需要的基础

1、java SE、EE(SSM)
90%的大数据框架都是Java写的
2、MySQL
SQL on Hadoop
3、Linux
大数据的框架安装在Linux操作系统上

- 需要学什么

大数据离线分析

一般处理T+1数据(T:可能是1天、一周、一个月、一年)
a、Hadoop :一般不选用最新版本,踩坑难解决
(common、HDES、MapReduce、YARN)
环境搭建、处理数据的思想
b、Hive:大数据的数据仓库
通过写SQL对数据进行操作,类似于MySQL数据库的sql
c、HBase:基于HDFS的NOSQL数据库
面向列存储
d、协作框架:
sqoop(桥梁:HDFS《==》RDBMS)
flume:搜集日志文件中的信息
e、调度框架
anzkaban
了解:crotab(Linux自带)
zeus(Alibaba)
Oozie(cloudera)
f、前沿框架扩展:
kylin、impala、ElasticSearch(ES)

大数据实时分析

以spark框架为主
Scala:OOP(面向对象程序设计)+FP(函数是程序设计)
sparkCore:类比MapReduce
sparkSQL:类比hive
sparkStreaming:实时数据处理
kafka:消息队列
前沿框架扩展:flink
阿里巴巴:blink

大数据机器学习

spark MLlib:机器学习库
pyspark编程:Python和spark的结合
推荐系统
python数据分析
python机器学习
阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: