大数据技能图谱
2016-04-07 14:42
330 查看
下面是 StuQ 发布的大数据技能图谱,比较实用,供参考
大数据处理框架
Spark
- RDD
- Spark SQL
- Spark Streaming
- MLLib
Hadoop
- HDFS (分布式文件系统)
- Mapreduce(计算框架)
- Yarn(资源管理平台)
- Pig(piglatin 语句到 mapreduce 的映射)
- Hive(数据仓库,提供 SQL)
- Mahout(机器学习算法的 mapreduce 实现库)
Kafka
Storm
ELK
- ElasticSearch
- Logstash
- Kibana
数据库
- SQL
- MySQL
- MongoDB
- Cassandra
- Redis
- SQLite
- bsddb
- HBase
编程语言
- Python
- R
- Ruby
数据分析挖掘
- MATLAB
- SPSS
- SAS
数据可视化
- R
- D3.js
- ECharts
- Excle
人工智能
- 聚类
- 时间序列
- 推荐系统
- 回归分析
- 文本挖掘
- 决策树
- 支持向量机
- 贝叶斯分类
- 神经网络
算法
一致性
- paxos
- raft
- gossip
数据结构
- 栈,队列,链表
- 散列表
- 二叉树,红黑树,B树
- 图
常用算法
- 排序(插入排序、桶排序、堆排序、快速排序)
- 最大子数组
- 最长公共子序列
- 最小生成树
- 最短路径
- 矩阵的存储和运算
云计算
- 云服务(SaaS、PaaS、IaaS)
- Openstack
- Docker
大数据处理框架
Spark
- RDD
- Spark SQL
- Spark Streaming
- MLLib
Hadoop
- HDFS (分布式文件系统)
- Mapreduce(计算框架)
- Yarn(资源管理平台)
- Pig(piglatin 语句到 mapreduce 的映射)
- Hive(数据仓库,提供 SQL)
- Mahout(机器学习算法的 mapreduce 实现库)
Kafka
Storm
ELK
- ElasticSearch
- Logstash
- Kibana
数据库
- SQL
- MySQL
- MongoDB
- Cassandra
- Redis
- SQLite
- bsddb
- HBase
编程语言
- Python
- R
- Ruby
数据分析挖掘
- MATLAB
- SPSS
- SAS
数据可视化
- R
- D3.js
- ECharts
- Excle
人工智能
- 聚类
- 时间序列
- 推荐系统
- 回归分析
- 文本挖掘
- 决策树
- 支持向量机
- 贝叶斯分类
- 神经网络
算法
一致性
- paxos
- raft
- gossip
数据结构
- 栈,队列,链表
- 散列表
- 二叉树,红黑树,B树
- 图
常用算法
- 排序(插入排序、桶排序、堆排序、快速排序)
- 最大子数组
- 最长公共子序列
- 最小生成树
- 最短路径
- 矩阵的存储和运算
云计算
- 云服务(SaaS、PaaS、IaaS)
- Openstack
- Docker
相关文章推荐
- 应用SuperIO(SIO)和开源跨平台物联网框架ServerSuperIO(SSIO)构建系统的整体方案
- 大数据和统计的区别
- 大数据揭秘网购诈骗:一万人中约有一人被骗
- LeetCode(31)-Factorial Trailing Zeroes
- LeetCode(31)-Factorial Trailing Zeroes
- LeetCode(31)-Factorial Trailing Zeroes
- 关于快速报错fail-fast想说的之fail-fast的避免方法(二)
- com.alibaba.dubbo.rpc.RpcException: Failed to invoke the method 错误处理
- Postfix-2.11+Dovecot-2.0.9+MySQL+Nginx+Cyrus-sasl+Extmail-1.2实现基于虚拟用户的邮件系统架构
- JetBrains Makes its Products Free for Students(JetBrains 对学生免费了)
- zz:Unable to open log device ‘/dev/log/main’: No such file or directory
- 百度地图(BaiduMap)定位工具类封装和使用
- postgres error : failed to read kind from backend
- web项目上云的思考
- 4.4.1 single_server_main函数:single_server执行模板“主函数”
- getaddrinfo EAI_AGAIN error
- 4.3.2.2 master_avail_event函数:调用master_spawn
- 4.3.2.1 master_avail_listen函数:挂载或卸载回调函数master_avail_event
- 4.3.2 master_avail.c:回调函数挂载策略
- 爬楼梯(LintCode Climbing Stairs)