graphx之图迭代
2016-09-12 19:57
204 查看
迭代
迭代思想是spark的精髓之一,所谓迭代,即每一步的输出结果作为下一步的输入,因而相邻迭代具有很强的关系。graphx更是将这种迭代思想运用的灵活高效。
联通分量
通过graphx lib中的ConnectedComponents连通分量算法,简单介绍迭代和消息传播机制。示例见下图:在完成顶点的初始化后,连通分支开始迭代过程:
为区分顶点自身id与连通分支id,后者称作cid。
1. 发送消息:若点的cid小于邻居顶点cid,则向邻居顶点发送自己的cid
2. 接收消息:若邻居顶点cid小于点cid,会接收到邻居顶点发送给自己的cid
3. 消息合并:选择所有消息中最小cid作为自身新的cid。
上图中,经过两轮迭代,已得到各连通分支,具有相同cid的点属于同一连通分支。
ConnectedComponents剖析
关于联通分量的介绍,以spark2.0中连通分量算法的源码为例:也许介绍到这里,你多少已理解消息传递过程,以及连通分量是如何实现的;可能对pregel模型并不是很懂;没事,下篇博客会认真梳理pregel迭代模型,希望对你有所帮助
相关文章推荐
- MISP3:细化迭代1_搭建框架
- 迭代与递归
- javascript语言扩展:可迭代对象(4)
- CodeForces - 505B Mr. Kitayuta's Colorful Graph —— 多维并查集
- [工具]toolbox_graph_normal_displayment
- tensorflow中的session和graph
- Python递归和迭代
- Learning Python Part II 之 迭代和推导式
- golang graphviz与pprof
- Clone Graph
- 迭代模式 - 行为模式
- 算法(六)Clone Graph
- [转]Data Structure Recovery using PIN and PyGraphviz
- 【算法】【Graph】Evaluate Division
- 二进制树型搜索算法选择电子标签的迭代过程
- code[vs]1004四子连棋(迭代深度优先搜索)
- 以四个在读写器作用范围内的电子标签为例说明二进制树型搜索算法选择电子标签的迭代过程
- JZOJ 5404. 【NOIP2017提高A组模拟10.10】Graph
- leetcode 日经贴,Cpp code -Clone Graph
- python可迭代对象和迭代器