您的位置:首页 > 其它

STL heap部分源码分析

2015-08-19 12:15 459 查看
本文假设你已对堆排序的算法有基本的了解。

要分析stl中heap的源码的独到之处,最好的办法就是拿普通的代码进行比较。话不多说,先看一段普通的堆排序的代码:

//调整大顶堆,使得结构合理
void max_heap(int a[],int node,int size)
{
int lg=node;
int l=node*2;
int r=node*2+1;
if(l<=size&&a[lg]<a[l])
{
lg=l;
}
if(r<=size&&a[lg]<a[r])
{
lg=r;
}
if(lg!=node)
{
//a[lg]=a[lg]^a[node];//交换
//a[node]=a[lg]^a[node];
//a[lg]=a[lg]^a[node];
int tt=a[lg];
a[lg]=a[node];
a[node]=tt;

max_heap(a,lg,size);
}
}
//生成一个大顶堆
void make_heap(int a[],int size)
{
for(int i=size/2;i>0;i--)
{
max_heap(a,i,size);
}
}
//堆排序,使数据在数组中按从小到大的顺序排列
void heap_sort(int a[],int size)
{
make_heap(a,size);
for(int i=1;i<size;i++)
{
int tt=a[1];
a[1]=a[size-i+1];
a[size-i+1]=tt;
max_heap(a,1,size-i);
}
}


对应第一个函数max_heap(),stl中有一个功能类似的函数adjust_heap(),也是调整整个heap,使之符合大顶堆的要求,代码如下:

// ============================================================================
// 保持堆的性质
//整个的过程是从根节点开始,将根节点和其子节点中的最大值对调,一直到叶节点为止(称之为下溯)
//然后,再从这个根节点开始,把它与其父节点进行比较,如果比父节点大,则父子节点对调,直到根节点为止(称之为上溯)
//============================================================================
// first 起始位置
// holeIndex 要进行调整操作的位置
// len 长度
// value holeIndex新设置的值
template <class _RandomAccessIterator, class _Distance, class _Tp>
void
__adjust_heap(_RandomAccessIterator __first, _Distance __holeIndex,
_Distance __len, _Tp __value)
{
// 当前根节点的索引值
_Distance __topIndex = __holeIndex;
// 右孩子节点的索引值
_Distance __secondChild = 2 * __holeIndex + 2;
// 如果没有到末尾
while (__secondChild < __len) {
// 如果右孩子节点的值比左孩子节点的值要小,那么secondChild指向左孩子
if (*(__first + __secondChild) < *(__first + (__secondChild - 1)))
__secondChild--;
// 子节点的往上升
*(__first + __holeIndex) = *(__first + __secondChild);
// 继续处理
__holeIndex = __secondChild;
__secondChild = 2 * (__secondChild + 1);
}
// 如果没有右子节点
if (__secondChild == __len) {
*(__first + __holeIndex) = *(__first + (__secondChild - 1));
__holeIndex = __secondChild - 1;
}
// 针对节点topIndex调用push_heap操作
__push_heap(__first, __holeIndex, __topIndex, __value);
}
//上溯
__push_heap(_RandomAccessIterator __first,
_Distance __holeIndex, _Distance __topIndex, _Tp __value)
{
// 获取父节点的索引值
_Distance __parent = (__holeIndex - 1) / 2;
// 如果还没有上升到根节点,且父节点的值小于待插入节点的值
while (__holeIndex > __topIndex && *(__first + __parent) < __value) {
// 父节点下降到holeIndex
*(__first + __holeIndex) = *(__first + __parent);
// 继续往上检查
__holeIndex = __parent;
__parent = (__holeIndex - 1) / 2;
}
// 插入节点
*(__first + __holeIndex) = __value;
}


stl里算法的堆的调整的主要流程如注释里所说,主要是先进行下溯,直到叶节点,然后用push_heap进行上溯才调增完毕。对比之前的普通代码,主要有3点改变:

把普通代码的递归操作变成了循环操作。这点很好理解,因为递归需要系统使用资源来维护递归栈,开销比较大,所以stl中除了sort的快排之外(因为快排的递归深度有限制),一般都会把递归的算法转换成循环来做。

普通代码中,我们直接比较根节点和左右节点的值,然后如果需要的话跟节点直接和较大的节点交换,这样只需要从上到下一趟比较,就能完成树的调整。而stl的代码中,则要先下溯,然后再上溯,两趟才能完成调整,看起来反而效率更低了,为什么呢?我仔细分析了代码,感觉可能有一下两点的原因:1.代码的复用,因为下溯的主要作用其实在保证大顶堆性质的前提下,让要调整的那个节点从根节点开始下沉,造成了一个新插入节点的假象,而push_heap()正是为了应对新插入节点而写的一个函2.数,这就复用了这块的代码。2.效率上的一点提升,因为下溯的过程只需要两个子节点的一次比较和根节点的一次赋值,而上溯的过程也只需要与根节点的一次比较和子节点的一次赋,所以合起来其实是两次赋值和两次比较;而普通的代码中,如果不考虑边界检查,找出三个点里的最大值,并与之交换,则至少需要两次比较,和三次赋值,所以stl的算法中,赋值运算少了一次,效率有所提升。

普通代码中,每次都需要对左子节点和右子节点进行边界的检查,而stl代码中,只对右子节点进行边界检查,为了防止右子节点越界而左子节点没有越界的情况发生,在循环结束后增加了对左子节点的边界检查。这一修改大幅度减少了边界检查的次数,明显提升了效率。

通过上述的分析,其实我们也可以以小见大。其实stl中,存在着大量这样的优化,递归转循环,减少边界检查,用赋值代替交换等等,如果我们能仔细研究,并在平时的编码中也养成这样的习惯,就能极大得提升代码的效率。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: