您的位置:首页 > 其它

《算法导论》读书笔记之第6章 堆排序

2015-03-23 18:22 274 查看
原文参考 http://www.cnblogs.com/Anker/archive/2013/01/23/2873422.html
本章开始介绍了堆的基本概念,然后引入最大堆和最小堆的概念。全章采用最大堆来介绍堆的操作,两个重要的操作是调整最大堆和创建最大堆,接着着两个操作引进了堆排序,最后介绍了采用堆实现优先级队列。

1、堆

  堆给人的感觉是一个二叉树,但是其本质是一种数组对象,因为对堆进行操作的时候将堆视为一颗完全二叉树,树中每个节点与数组中的存放该节点值的那个元素对应。所以堆又称为二叉堆,堆与完全二叉树的对应关系如下图所示:

#include<stdio.h>
#define NOUSEDATA -65536
#define LEN 9
int LEFT(int i){
return 2*i;
}
int RIGHT(int i){
return 2*i+1;
}
void max_heapify(int A[],int length,int i){
int l,r,largest;
int temp;
l= LEFT(i);
r= RIGHT(i);
if(l<= length && A[l]>A[i])
largest = l;
else largest = i;

if(r<= length && A[r]>A[largest])
largest = r;

if (largest != i) {
temp = A[i];
A[i] = A[largest];
A[largest] = temp;
max_heapify(A,length,largest);
}
}
void build_max_heap(int a[],int length) {
int i;
for(i=length/2; i>0; i--) {
max_heapify(a,LEN,i);
}
}
void heap_sort(int A[],int length) {
int i;
int temp;
build_max_heap(A,length);
for(i=length; i>1; i--){
temp = A[1];
A[1] = A[i];
A[i] = temp;//因为是最大堆,A[1]就是最大值,所以A[i]始终保存最大值。
length--;
max_heapify(A,length,1);
}
}

int main(void) {
int i;
int A[LEN+1]={NOUSEDATA, 4, 5, 34, 2, 98, 15, 23, 7, 99};
for(i=1;i<=9;i++ ) {
printf("%d ",A[i]);
}
printf("\n");
heap_sort(A,LEN);
for(i=1;i<=LEN;i++ ) {
printf("%d ",A[i]);
}
printf("\n");
return 0;
}
#if(0)
//非递归的方法
void max_heap(int A[],int length, int i){
}
#endif


View Code
程序测试结果如下所示:



从结果可以看出按照最大堆进行堆排序最终使得结果是从小到大排序(非递减的)。

堆排序算法时间复杂度:调整堆过程满足递归式T(n)<=T(2n/3)+θ(1),有master定义可以知道T(n) = O(lgn),堆排序过程中执行一个循环,调用最大堆调整函数,总的时间复杂度为O(nlgn)。

5、问题

(1)课后习题要求给出其非递归的形式,我想了半天,才搞出来,领悟能力有限啊。非递归就要考虑要循环进行实现,需要考虑的是循环结束条件是什么。对一个给定的节点i,要对其进行调整使其满足最大堆的性质。总的思想是先找出节点i的左右孩子节点,然后从三者中找到最大的节点,如果找到的最大节点就是i,说明i节点满足堆的性质,此时循环就结束了。如果找到的最大节点不是节点i,那么这个时候就要将最大的节点(设为largest)与节点i进行交换,然后从largest节点开始循环进行调整,直到满足条件为止。给出非递归的调整堆程序如下:

#if(1)
//非递归的方法
void max_heap(int a[],int length, int i){
int l,r,largest;
int temp;
l= LEFT(i);
r= RIGHT(i);
do{

if(l<= length && a[i]<a[l]){
largest = l;
}
else
largest = i;
if(r<= length && a[largest]< a[r]) {
largest = r;
}

if(largest != i) {
temp = a[i];
a[i] = a[largest];
a[largest] = temp;
i = largest;
l = LEFT(i);
r= RIGHT(i);
}
else {
break;
}
}while(largest <= length);

}

#endif


实则就是模拟了递归的过程,循环结束条件表面上为largest要小于结点个数,实则退出循环是因为break语句,因为l或者r都要比largest大,只要largest = i就认为该结点满足最大堆性质。采用do while结构是为了让largest能被初始化。

增加结点数,程序运行结果为:



(2)在创建最大堆的过程中,为什么从最后一个非叶子节点(n/2)开始到第一个非叶子(1)结束,而不是从第一个非叶子节点(1)到最后一个非叶子节点(n/2)结束呢?

我的想法是:如果是从第一个非叶子节点开始创建堆,有可能导致创建的堆不满足最大堆的性质,从第一个非叶子节点(1)到最后一个非叶子节点(n/2)创建,后面的结点在调整的过程中可能会破坏第一个结点创建好的最大堆结构。反过来就不一样,因为第

一个结点的递归次数最多,第一个结点放在最后调整,因为递归深度大,可以把之前打乱的给修复好。

如果是从第一个非叶子节点开始创建堆,有可能导致创建的堆不满足堆的性质,使得第一个元素不是最大的。这样做只是使得该节点的和其左右孩子节点满足堆性质,不能确保整个树满足堆的性质。如果最大的节点在叶子节点,那么将可能不会出现在根节点

中。例如下面的例子:



从图中可以看出,从第一个非叶子节点开始创建最大堆,最后得到的结果并不是最大堆。而从最后一个非叶子节点开始创建堆时候,能够保证该节点的子树都满足堆的性质,从而自底向上进行调整堆,最终使得满足最大堆的性质。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: