您的位置：首页 > 理论基础 > 数据结构算法

数据结构之拓扑排序

2015-11-15 14:28 267 查看

拓扑排序介绍

拓扑排序(Topological Order)是指，将一个有向无环图(Directed Acyclic Graph简称DAG)进行排序进而得到一个有序的线性序列。

这样说，可能理解起来比较抽象。下面通过简单的例子进行说明！

例如，一个项目包括A、B、C、D四个子部分来完成，并且A依赖于B和D，C依赖于D。现在要制定一个计划，写出A、B、C、D的执行顺序。这时，就可以利用到拓扑排序，它就是用来确定事物发生的顺序的。

在拓扑排序中，如果存在一条从顶点A到顶点B的路径，那么在排序结果中B出现在A的后面。

拓扑排序的算法图解

拓扑排序算法的基本步骤：

1. 构造一个队列Q(queue) 和拓扑排序的结果队列T(topological)；

2. 把所有没有依赖顶点的节点放入Q；

3. 当Q还有顶点的时候，执行下面步骤：

3.1 从Q中取出一个顶点n(将n从Q中删掉)，并放入T(将n加入到结果集中)；

3.2 对n每一个邻接点m(n是起点，m是终点)；

3.2.1 去掉边<n,m>;

3.2.2 如果m没有依赖顶点，则把m放入Q;

注：顶点A没有依赖顶点，是指不存在以A为终点的边。

以上图为例，来对拓扑排序进行演示。

第1步：将B和C加入到排序结果中。

顶点B和顶点C都是没有依赖顶点，因此将C和C加入到结果集T中。假设ABCDEFG按顺序存储，因此先访问B，再访问C。访问B之后，去掉边<B,A>和<B,D>，并将A和D加入到队列Q中。同样的，去掉边<C,F>和<C,G>，并将F和G加入到Q中。

(01) 将B加入到排序结果中，然后去掉边<B,A>和<B,D>；此时，由于A和D没有依赖顶点，因此并将A和D加入到队列Q中。

(02) 将C加入到排序结果中，然后去掉边<C,F>和<C,G>；此时，由于F有依赖顶点D，G有依赖顶点A，因此不对F和G进行处理。

第2步：将A,D依次加入到排序结果中。

第1步访问之后，A,D都是没有依赖顶点的，根据存储顺序，先访问A，然后访问D。访问之后，删除顶点A和顶点D的出边。

第3步：将E,F,G依次加入到排序结果中。

因此访问顺序是：B -> C -> A -> D -> E -> F -> G

拓扑排序的代码说明

拓扑排序是对有向无向图的排序。下面以邻接表实现的有向图来对拓扑排序进行说明。

1. 基本定义

// 邻接表中表对应的链表的顶点
typedef struct _ENode
{
int ivex;                   // 该边所指向的顶点的位置
struct _ENode *next_edge;   // 指向下一条弧的指针
}ENode, *PENode;

// 邻接表中表的顶点
typedef struct _VNode
{
char data;              // 顶点信息
ENode *first_edge;      // 指向第一条依附该顶点的弧
}VNode;

// 邻接表
typedef struct _LGraph
{
int vexnum;             // 图的顶点的数目
int edgnum;             // 图的边的数目
VNode vexs[MAX];
}LGraph;

(01) LGraph是邻接表对应的结构体。 vexnum是顶点数，edgnum是边数；vexs则是保存顶点信息的一维数组。

(02) VNode是邻接表顶点对应的结构体。 data是顶点所包含的数据，而firstedge是该顶点所包含链表的表头指针。

(03) ENode是邻接表顶点所包含的链表的节点对应的结构体。 ivex是该节点所对应的顶点在vexs中的索引，而nextedge是指向下一个节点的。

2. 拓扑排序

/*
* 拓扑排序
*
* 参数说明：
*     G -- 邻接表表示的有向图
* 返回值：
*     -1 -- 失败(由于内存不足等原因导致)
*      0 -- 成功排序，并输入结果
*      1 -- 失败(该有向图是有环的)
*/
int topological_sort(LGraph G)
{
int i,j;
int index = 0;
int head = 0;           // 辅助队列的头
int rear = 0;           // 辅助队列的尾
int *queue;             // 辅组队列
int *ins;               // 入度数组
char *tops;             // 拓扑排序结果数组，记录每个节点的排序后的序号。
int num = G.vexnum;
ENode *node;

ins  = (int *)malloc(num*sizeof(int));  // 入度数组
tops = (char *)malloc(num*sizeof(char));// 拓扑排序结果数组
queue = (int *)malloc(num*sizeof(int)); // 辅助队列
assert(ins!=NULL && tops!=NULL && queue!=NULL);
memset(ins, 0, num*sizeof(int));
memset(tops, 0, num*sizeof(char));
memset(queue, 0, num*sizeof(int));

// 统计每个顶点的入度数
for(i = 0; i < num; i++)
{
node = G.vexs[i].first_edge;
while (node != NULL)
{
ins[node->ivex]++;
node = node->next_edge;
}
}

// 将所有入度为0的顶点入队列
for(i = 0; i < num; i ++)
if(ins[i] == 0)
queue[rear++] = i;          // 入队列

while (head != rear)                // 队列非空
{
j = queue[head++];              // 出队列。j是顶点的序号
tops[index++] = G.vexs[j].data; // 将该顶点添加到tops中，tops是排序结果
node = G.vexs[j].first_edge;    // 获取以该顶点为起点的出边队列

// 将与"node"关联的节点的入度减1；
// 若减1之后，该节点的入度为0；则将该节点添加到队列中。
while(node != NULL)
{
// 将节点(序号为node->ivex)的入度减1。
ins[node->ivex]--;
// 若节点的入度为0，则将其"入队列"
if( ins[node->ivex] == 0)
queue[rear++] = node->ivex;  // 入队列

node = node->next_edge;
}
}

if(index != G.vexnum)
{
printf("Graph has a cycle\n");
free(queue);
free(ins);
free(tops);
return 1;
}

// 打印拓扑排序结果
printf("== TopSort: ");
for(i = 0; i < num; i ++)
printf("%c ", tops[i]);
printf("\n");

free(queue);
free(ins);
free(tops);
return 0;
}

说明：

(01) queue的作用就是用来存储没有依赖顶点的顶点。它与前面所说的Q相对应。

(02) tops的作用就是用来存储排序结果。它与前面所说的T相对应。

用顶点表示活动，用弧表示活动之间的优先关系，这样的有向图为顶点表示活动的网，称之为AOV网(Activity On Vertex Network)。AOV网中的弧表示活动之间存在的某种制约关系
设G(V，E)是一个具有一条路径，则在顶点序列中顶点Vi必在顶点Vj之前，这样的顶点序列为一个拓扑序列
拓扑排序：就是对一个有向图构造拓扑序列的过程。如果构造时网的全部顶点都被输出，则说明它不存在环的AOV网；如果输出顶点数少了，说明这个网存在环，不是AOV网

拓扑排序算法
思路：从AOV网中选择一个入度为0的顶点输出（入度为0代表没有顶点的顺序在此顶点的前面），然后删去此顶点，并删除以此顶点为尾的弧，继续重复此步骤，直到输出全部顶点或者AOV网中不存在入度为0的顶点为止。
数据结构：

in	data	firstedge
入度的数目：因为算法过程中始终需要查找入度为0的顶点		第一个邻接点

①之所以用到邻接表，是因为要删除顶点，邻接表会更加方便；②可以利用栈，用来存储处理过程中入度为0的顶点，目的是为了避免每个查找是都要去遍历顶点表栈有没有入度为0的顶点
入栈的时间复杂度为O(n)，而之后的while循环，每个顶点进一次栈，出一次栈，入度减1的操作工执行了e次，所以整个算法的时间复杂度为O( n+e )

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航