Spark学习知识点
2015-10-13 10:59
357 查看
1.Spark集群部署及开发环境搭建。内容包括Hadoop集群、Spark集群搭建,Intellij IDEA Spark开发环境搭建, Spark Shell的使用等。
2.Spark 运行原理。内容包括spark脚本文件解析、Spark 几种不同运行方式、RDD原理、宽依赖与窄依赖、Spark 任务调度等。
3.Spark 编程模型,介绍Spark编程模型、对常用的transformation及action操作进行介绍。
4.Spark SQL与DataFrame,介绍Spark SQL 及DataFrame的运行原理及使用方法,利用案例介绍Spark SQL的使用。
5.Spark 流式计算。介绍DStream、Spark Streaming原理,并通过几个案例说明其使用。
6.Spark 机器学习。介绍Spark MLlib架构,通过K-Mean算法、随机森林等算法说明Spark MLlib的使用。
7.Spark Graphx。介绍Spark图计算及相关数据结构,用PageRank算法说明其使用。
2.Spark 运行原理。内容包括spark脚本文件解析、Spark 几种不同运行方式、RDD原理、宽依赖与窄依赖、Spark 任务调度等。
3.Spark 编程模型,介绍Spark编程模型、对常用的transformation及action操作进行介绍。
4.Spark SQL与DataFrame,介绍Spark SQL 及DataFrame的运行原理及使用方法,利用案例介绍Spark SQL的使用。
5.Spark 流式计算。介绍DStream、Spark Streaming原理,并通过几个案例说明其使用。
6.Spark 机器学习。介绍Spark MLlib架构,通过K-Mean算法、随机森林等算法说明Spark MLlib的使用。
7.Spark Graphx。介绍Spark图计算及相关数据结构,用PageRank算法说明其使用。
相关文章推荐
- Nim Game
- Android 学习笔记七:使用Fragment创建动态UI
- centos6上redis搭建配置
- C++之并行开发
- UIImageView的图片居中问题
- selenium exceptionin java (org.openqa.selenium.remote.UnreachableBrowserException)
- SPDY 是什么?如何部署 SPDY?
- Dark roads(MST模板)
- C#使用PrintDocument打印 多页 打印预览
- css sprint 生成工具 bg2css
- Laravel5 cookie和session设置
- 图文详解远程部署ASP.NET MVC 5项目 [转载]
- JavaScript中创建对象的几种方式
- Scala基本知识点
- Xcode6中创建分类、协议等文件的方法
- Android_数据存储——SharedPreferences .
- NSFileManager Class Reference
- Yarn HA解决方案
- spark1.5 scala.collection.mutable.WrappedArray$ofRef cannot be cast to ...解决办法
- spark1.5 scala.collection.mutable.WrappedArray$ofRef cannot be cast to ...解决办法