0051 大数据架构师技能图谱
2016-06-21 19:19
519 查看
大数据通用处理平台
Spark
Flink
Hadoop
分布式存储
HDFS
资源调度
Yarn
Mesos
机器学习工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微软分布式机器学习工具)
数据分析/数据仓库(SQL类)
Pig
Hive
kylin
Spark SQL,
Spark DataFrame
Impala
Phoenix
ELK
8.1 ElasticSearch
8.2Logstash
8.3Kibana
消息队列
Kafka(纯日志类,大吞吐量)
RocketMQ
ZeroMQ
ActiveMQ
RabbitMQ
流式计算
Storm/JStorm
Spark Streaming
Flink
日志收集
Scribe
Flume
编程语言
Java
Python
R
Ruby
Scala
数据分析挖掘
MATLAB
SPSS
SAS
数据可视化
R
D3.js
ECharts
Excle
Python
聚类
时间序列
推荐系统
回归分析
文本挖掘
决策树
支持向量机
贝叶斯分类
神经网络
机器学习工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微软分布式机器学习工具)
paxos
raft
gossip
数据结构
栈,队列,链表
散列表
二叉树,红黑树,B树
图
插入排序
桶排序
堆排序
2.快速排序
3,最大子数组
4.最长公共子序列
5.最小生成树
最短路径
6.矩阵的存储和运算
SaaS
PaaS
IaaS
Openstack
Docker、
转自:http://www.ha97.com/5734.html?utm_source=tuicool&utm_medium=referral
Spark
Flink
Hadoop
分布式存储
HDFS
资源调度
Yarn
Mesos
机器学习工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微软分布式机器学习工具)
数据分析/数据仓库(SQL类)
Pig
Hive
kylin
Spark SQL,
Spark DataFrame
Impala
Phoenix
ELK
8.1 ElasticSearch
8.2Logstash
8.3Kibana
消息队列
Kafka(纯日志类,大吞吐量)
RocketMQ
ZeroMQ
ActiveMQ
RabbitMQ
流式计算
Storm/JStorm
Spark Streaming
Flink
日志收集
Scribe
Flume
编程语言
Java
Python
R
Ruby
Scala
数据分析挖掘
MATLAB
SPSS
SAS
数据可视化
R
D3.js
ECharts
Excle
Python
机器学习
机器学习基础聚类
时间序列
推荐系统
回归分析
文本挖掘
决策树
支持向量机
贝叶斯分类
神经网络
机器学习工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微软分布式机器学习工具)
算法
一致性paxos
raft
gossip
数据结构
栈,队列,链表
散列表
二叉树,红黑树,B树
图
常用算法
1.排序插入排序
桶排序
堆排序
2.快速排序
3,最大子数组
4.最长公共子序列
5.最小生成树
最短路径
6.矩阵的存储和运算
云计算
云服务SaaS
PaaS
IaaS
Openstack
Docker、
转自:http://www.ha97.com/5734.html?utm_source=tuicool&utm_medium=referral
相关文章推荐
- 简单易懂云计算(转自天涯感谢原楼主iamsatisfied)
- 2011云计算知识库:盘点千奇百怪的云名称
- 学习prefuse
- openstack kilo-with-dokcer
- 康诺云推出三款智能硬件产品,为健康管理业务搭建数据池
- MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程
- php+ajax导入大数据时产生的问题处理
- C# 大数据导出word的假死报错的处理方法
- 用Python实现协同过滤的教程
- Python利用多进程将大量数据放入有限内存的教程
- mongodb常遇到的错误。
- 3ff8 《sharepoint 2010云计算解决方案》使用SQL Azure 的BI 解决方案
- IaaS, PaaS, SaaS 解释
- 在Google使用Borg进行大规模集群的管理 3-4
- 在Google使用Borg进行大规模集群的管理 5-6
- 在Google使用Borg进行大规模集群的管理 7-8
- 未来的容器云技术栈会怎么样?在容器技术大会上的演讲
- Stack数据结构的特点后进先出的应用:大数据运算
- Spark机器学习(一) -- Machine Learning Library (MLlib)
- Spark机器学习(二) 局部向量 Local-- Data Types - MLlib