Spark术语解释
2015-07-31 22:55
169 查看
术语解释
名词 | 含义 |
---|---|
Application | 用户在spark上的程序,由一个driver程序和数个executor组成 |
Application jar | 包含用户Spark应用程序的jar包 |
Driver program | 运行main函数并且创建SparkContext的程序 |
Cluster manager | 集群的资源管理器,可以获取集群中资源的外部服务 |
Deploy mode | driver的部署运行模式,分”cluster”和”client”两种模式。在”cluster”模式下,框架会在集群中的任意一台机器上启动driver;在”client”模式下,dirver会在集群外被提交者启动。 |
Worker node | 集群中任何一个可以运行spark应用代码的节点。Worker Node就是物理节点,可以在上面启动Executor进程。 |
Executor | 应用在worker节点上启动的进程,运行任务,并将数据保存在内存或者磁盘上。每个应用都有各自独立的executor。 |
Task | 被发送到executor上的工作单元。 |
Job | 包含很多个task的并行计算,可以认为是Spark RDD中的action,每个action的计算会生成一个job。 |
Stage | 每个job会被拆分成多组task,每组task被称为stages(类似MR中的map stage 和 reduce stage)。 |
相关文章推荐
- Java GC与finalize方法
- Can you answer these queries?---hdu4027
- 最大似然估计和最大后验概率MAP
- 玩转AJAX(第一天) AJAX基础
- KMP匹配
- Leetcode #78 Subsets
- VC++内存泄漏定位(依赖MFC)
- MATLAB符号运算
- MATLAB符号运算 分类: 图像处理 2015-07-31 22:53 3人阅读 评论(0) 收藏
- PHP中命名空间的引用
- nyoj 6喷水装置(一)
- hdu 4336 Card Colletor 动态规划-概率dp
- Spring+SpringMVC+MyBatis+LogBack+C3P0+Maven+Git小结
- Linux性能评测工具之一:gprof篇
- 随想录(网络编程中的一些问题)
- PHP中命名空间的创建-使用namespace
- 笔记:红帽子Linux下安装jdk1.8
- 1022:Train Problem I
- Java Heap Stack
- Activity横竖屏切换不重绘界面