您的位置:首页 > 理论基础 > 数据结构算法

算法导论 第21章 不相交集合的数据结构

2012-09-14 11:20 225 查看
文章作者:Slyar 文章来源:Slyar Home (www.slyar.com) 转载请注明,谢谢合作。

等价关系与等价类

从数学上看,等价类是一个对象(或成员)的集合,在此集合中的所有对象应满足等价关系。若用符号"≡"表示集合上的等价关系,那么对于该集合中的任意对象x,y, z,下列性质成立:

1、自反性:x ≡ x

2、对称性:若 x ≡ y 则 y ≡ x

3、传递性:若 x ≡ y 且 y ≡ z 则 x ≡ z

因此,等价关系是集合上的一个自反、对称、传递的关系。



通过金属线连接起来的电器的连通性,就是一种等价关系。这种关系显然具有自反性,因为任何一个器件都是与自身连通的;如果a 电连通b,那么b一定也电连通a,因此这种关系具有对称性; 若a连通到b,并且b连通到c,那么a连通到c 。

不相交集合的链表表示

每一个集合用一个链表表示。每个链表中的第一个对象作为它所在集合的代表。

每一个对象的结构:

1)集合成员

2)指向包含下一个集合成员的对象的指针

3)指向代表的指针

每个链表都包含head指针和tail指针,head指向链表的代表,tail指向链表中最后的对象。

MAKE-SET(x): O(1),创建新链表,其仅有对象为x

FIND-SET(x): O(1),返回x指向代表的指针

UNION(x,y): 将x所在的链表拼接到y所在链表的表尾。注意,对于原先x所在链表中的每一个对象,都需要更新其指向代表的指针。

加权合并启发式策略:设每个表还包括了表的长度,合并时,总是把较短的表拼到较长的表上。

使用加权合并策略,对m个MAKE-SET, UNION和FIND-SET操作所构成的序列(其中n个MAKE-SET操作,因此UNION操作的次数至多为n-1),花费的总时间为O(m+nlgn)。

不相交集合森林

并查集的一般用途就是用来维护某种具有自反、对称、传递性质的关系的等价类。并查集一般以树形结构存储,多棵树构成一个森林,每棵树构成一个集合,树中的每个节点就是该集合的元素,找一个代表元素作为该树(集合)的祖先。

并查集支持以下三种操作:

1、Make_Set(x) 把每一个元素初始化为一个集合

初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身。

2、Find_Set(x) 查找一个元素所在的集合

查找一个元素所在的集合,只要找到这个元素所在集合的祖先即可。判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。

3、Union(x,y) 合并x,y所在的两个集合

合并两个不相交集合操作很简单:首先设置一个数组Father[x],表示x的"父亲"的编号。那么,合并两个不相交集合的方法就是,找到其中一个集合的祖先,将另外一个集合的祖先指向它。



并查集的优化

1、Find_Set(x)时 路径压缩

寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?

答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回归"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了。



2、Union(x,y)时 按秩合并

即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。

思想是使包含较少结点的树的根指向包含较多结点的树的根,并不是显式的记录以每个结点为根的子树大小,而是一种简化分析的方法。用秩表示结点高度的一个上界。在按秩合并中,具有较小秩的根在UNION操作中要指向较大秩的根。

如果将按秩合并和路径压缩分开使用的话,都不能改善不相交集合森林的操作的运行时间;如果联合起来使用,则改善的幅度更大。两种方同时使用的时候,最坏情况运行时间为O(ma(n)),其中a(n)是一个增长极其缓慢的函数。其中路径压缩和按秩合并完全兼容,使得两个优化方法可以同时实现。定理证明:M次Union和Find的运行时间为O(MlogN)。

c语言实现源码:

#include <stdio.h>
#include <stdlib.h>
#include "disjset.h"

/*不想交集ADT的数据结构:使用树来表示每一个集合,树上的每一个元素都有相同的根。
S[i] < 0表示结点i为树的根结点,S[i]的绝对值表示树的秩(树的高度的估值)。
S[i] > 0表示i结点是非根结点,S[i]表示结点i的父亲结点。*/

/*开始时每个集合含有一个元素,该元素都为一个集合的根节点*/
void initialize(DisjSet S)
{
int i;
for( i = NumSets; i > 0; i --)
S[i] = -1;
}
/*按秩求并,使得较小秩的树成为较大秩的树的子树*/
void SetUnion(DisjSet S, SetType Root1, SetType Root2)
{
if(S[Root2] < S[Root1])/*Root2树的秩大于Root1树的秩,把Root1合并到Root2上*/
{
S[Root1] = Root2;
}
else/*Root1树的秩大于等于Root2树的秩,把Root2合并到Root1上*/
{
if(S[Root1] == S[Root2])
S[Root1] --;
S[Root2] = Root1;
}
}
/*路径压缩*/
SetType Find(ElementType X, DisjSet S)
{
if(S[X] <= 0)
return X;
else
return S[X] = Find(S[X], S);/*把X到根的路径上的每个结点都使它的父节点变成根*/
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: