您的位置:首页 > 理论基础 > 数据结构算法

常用的搜索排序算法总结

2016-03-07 16:28 330 查看
搜索排序算法总结
一、
二分查找
算法过程:
A、假设表中元素按升序排列
B、若中间元素与查找目标相等,则查找成功,否则利用中间元素将表划分为前后两个有序子表
C、若查找目标小于中间元素,则在前子表中查找,否则在后子表中查找
D、重复以上过程,直到查找成功,或者因子表不存在而宣告查找失败
评价:
1).效率比线性搜索高,在最坏情况下需要比较log2N次
2).要求表必须是有序表,特别适用于已经建立就很少改动的而又需要经常查找的线性表
3).在结构上具备递归特性,可以采用递归的方式实现

代码实现:

[cpp] view
plain

int BinarySearch(int data[],int left,int right,int key){  

    int mid = (left + right)/2;  

    if(left <= right){  

        if(key < data[mid]){  

            BinarySearch(data,left,mid-1,key);  

        }  

        else if(key > data[mid]){  

            BinarySearch(data,mid+1,key);  

        }  

        else{  

            return mid;  

        }  

    }  

    else{  

        return -1;  

    }  

}  

二、
排序算法(默认为升序排序)
相关概念:
内排序:在排序过程中,若整个表都是放在内存中处理,排
序时不涉及数据的内、外存交换,称之为内排序     
外排序:若排序过程中需要进行数据的内外存交换,则
称之为外排序
稳定排序:假设在待排序的序列中存在相同的元素,在经过排序
后,两个元素之间的相互次序不发生变化,则称之为稳定排序,否则为不稳定排序
1.
交换排序:
基本思想:两两比较待排序记录的关键字,发现两个记录的次序相反时即进行交换,直到没有反序的记录为止。
常见的有冒泡排序和快速排序
1).冒泡排序
算法过程:
A.
相邻元素两两比较,前者大于后者,彼此交换
B.
从第一对到最后一对,最大的元素沉降到最后
C.
针对未排序的部分,重复以上步骤,沉降次大的值
D.
每次扫描越来越少的元素,直至不再发生交换
评价:
A.
平均时间复杂度:O(N2);
B.
属于稳定排序
C.
对数据的有序性非常敏感(即当表越接近有序状态时,冒泡排序可能是最快的排序)
代码实现:

[cpp] view
plain

void bubble_sort(int data[],size_t size){  

    int i,j;  

    for(i = 0;i < size - 1;i++){  

        int ordered = 1;  

        for(j = 0;j < size-1-i;j++){  

            if(data[j+1] < data[j]){  

                int swap = data[j];  

                data[j] = data[j+1];  

                data[j+1] = swap;  

                ordered = 0;  

            }  

        }  

        if(ordered)  

            break;  

    }  

}  

2)快速排序
算法过程:
A.从待排序序列中任意挑选一个元素作为基准
B.将所有小于基准的元素放在基准之前,大于基准的元素放在基准之后,等于基准的元素任意放在基准之前或之后,这个过程叫做分组
C.以递归的方式,分别对基准之前和之后的分组继续进行分组,直到每个分组内的元素个数不多于1个
评价:
A.平均时间复杂度:O(NlogN)
B.不是稳定排序
C.对数据的有序性不敏感
代码实现:

[cpp] view
plain

void QuickSort(int data[],size_t left,size_t right){  

    size_t mid = (left + right)/2;  

    int tmp = data[mid];  

    size_t i = left,j = right;  

    while(i < j){  

        for(;i < mid && data[i] <= tmp;i++);//找到大于基准的值的下标   

        if(i < mid){  

            data[mid] = data[i];  

            mid = i;  

        }  

        for(;j > mid && data[j] >= tmp;j--);//找到小于基准的值的下标  

            if(j > mid){  

                data[mid] = data[j];  

                mid = j;  

            }  

    }  

    data[mid] = tmp;  

    if(mid - left > 1)  

        QuickSort(data,left,mid - 1);  

    if(right - mid > 1)  

        QuickSort(data,mid + 1,right);  

}  

2.插入排序:
基本思想:每次将一个待排序的记录按照关键字的大小插入到
前面已经排好序的子表中的适当位置,直到全部记录插入完成
1).直接插入排序
算法过程:
A.
在开始时将序列划分为两个分区,第一个分区中只有首元素,自然有序,第二个分区中包含剩下的元素
B.
取出下一个元素,对已排序序列进行从后向前扫描
C.
将大于被取出元素者后移
D.
小于或等于被取出元者者,将取出元素插入其中
E.
重复步骤B,直到处理完所有的元素
评价:
A.平均时间复杂度:O(N2)
B.属于稳定排序
C.对数据的有序性非常敏感
D.不交换只移动,效率略高于冒泡排序法
代码实现:

[cpp] view
plain

void InsertSort(int data[],size_t size){  

    size_t i;  

    for(i = 1;i < size;i++){  

        int inserted = data[i];  

        size_t j;  

        for(j = i;j > 0 && inserted < data[j-1];j--){  

            data[j] = data[j-1];  

        }  

        if(j != i)  

            data[j] = inserted;  

    }  

}  

2).希尔排序
算法过程:
A.选取一个小于序列长度n的正整数d1作为增量,将序列分为d个分组
B.对每个分组进行直接插入排序,使其变成有序序列
C.选取一个小于d1的正整数d2,将序列分为d2个组
D.重复步骤B和C,直到取得的增量等于1
评价:
A.平均时间复杂度:O(N1.3)[由于希尔排序的性能取决于增量选取的大小,而增量的大小选取并无定论,因此一般认为其平均时间复杂度为O(N1.3)]
B.是不稳定排序
C.排序效率通常比直接插入排序要高
D.属于就地排序
代码实现:

[cpp] view
plain

void ShellSort(int data[],size_t size){  

      int i,j,gap,tmp;  

       gap = size/2;  

       while(gap > 0){  

          for(i = gap;i <= size;i++){  

              tmp = data[i];  

              j = i - gap;  

              while(j >= 0 && tmp < data[j]){  

                  data[j+gap] = data[j];  

                  j = j - gap;  

              }  

              data[j+gap] = tmp;  

          }  

          gap /= 2;  

      }  

  }  

3.选择排序
基本思想:每一趟从待排序的记录中选出关键字最小的记录,顺序放在已排好序的子表的最后,直到全部的记录排序完毕
常见的有直接选择排序和堆排序
1).直接选择排序
算法过程:
A.
在整个序列中寻找最小元素,找到之后与首元素交换
B.
在剩余序列中寻找最小元素,找到之后与次元素交换
C.
以此类推,直到剩余序列中仅包含一个元素
评价:
A.平均时间复杂度: O(N2)
B.不是稳定排序
C.对数据的有序性不敏感
D.交换次数少,优于冒泡
代码实现:

[cpp] view
plain

void select_sort(int data[],size_t size){  

       size_t i;  

       for(i = 0;i < size - 1;i++){  

           size_t min = i,j;  

          for(j = i+1;j < size;j++)  

              if(data[j] <= data[min])  

                  min = j;  

          if(min != i){  

              int swap =  data[i];  

              data[i] = data[min];  

              data[min] = swap;  

          }  

      }  

 }  

4.归并排序
基本思想:多次将两个或两个以上的有序表合并成一个新的有序表。最简单的归并是直接将两个有序子表归并成一个有序表,即二路归并
算法过程:
A.
将序列中的每个元素独立进行归并(单独一个元素肯定是有序表)
B.
以此类推,不断的对序列进行归并。
C.
若序列中元素的个数为奇数个,则最后有一个子表的长度会小于其他子表,则修改子表上界并对其进行归并
评价:
A.
归并排序是一种稳定排序
B.
归并排序易于在链表上实现。对于长度为n的表,需要进行log2n次排序,每次归并的时间为O(n),其时间复杂度无论是在最好还是最坏的情况下都是O(nlog2n)
C.
归并排序中,每次都需要一个辅助向量来暂存两个有序子表来暂存结果,但在该次排序结束后便释放空间,所以总的辅助空间复杂度为O(n)。归并排序并不是就地排序
代码实现:

[cpp] view
plain

//一趟归并的算法实现  

void Merge(int data[],int low,int mid,int high){  

    int* R1 = (int*)malloc((high - low + 1) * sizeof(int));     //分配一个辅助存储空间  

    int i = low,j = mid + 1,k = 0;  

    while(i <= mid && j <= high)  

        if(data[i] <= data[j]){  

            R1[k] = data[i];  

            k++;  

            i++;  

        }  

        else{  

            R1[k] = data[j];  

            k++;  

            j++;  

        }  

    //当两个子表的长度不同时,将未完的子表复制到R1中去  

    while(i <= mid){  

        R1[k] = data[i];  

        k++;  

        i++;  

    }  

    while(j <= high){  

        R1[k] = data[j];  

        k++;  

        j++;  

    }  

    //将整个R1数组放回到data中去,完成一次归并  

    for(k = 0,i = low;i <= high;k++,i++)  

        data[i] = R1[k];  

    free(R1);  

}  

void MergePass(int data[],int length,int n){  

    int i;  

    for(i = 0;i + 2 * length - 1 < n;i += 2 * length)  

        Merge(data,i,i + length - 1,i + 2 * length - 1);  

    //当待排序的数组元素个数为奇数个时,继续归并剩下的两个子表  

    if(i + length - 1 < n)  

        Merge(data,i,i + length - 1,n - 1);  

}  

void MergeSort(int data[],int n){  

    int length;  

    for(length = 1;length < n;length *= 2)  

        MergePass(data,length,n);  

}  

每一种排序方法都有自己的局限性,应当根据不同的环境选择最为合适的算法。
总结:
1.当待排序的序列个数n较少(n<=50),可以采用直接插入或直接选择排序。当记录规模较小时,直接插入排序较好。否则因为直接选择移动的记录数少于直接插入,则应选择直接选择排序。
2.若序列的状态基本有序,则应选用直接插入、冒泡或随机快速排序为宜
3.当n较大,则应采用时间复杂度为O(nlog2n)的排序方法,快速排序,归并排序。快速排序是目前基于比较的内排序方法中被认为是较好的方法。当待排序关键字是随机分布时,快速排序的平均时间最短。但这种排序是不稳定的,若需要稳定排序,则应采用归并排序。

4.若有两个有序表,要将其合并成一个新的有序表,最好的方法是归并排序

By:http://blog.csdn.net/phoenix500526/article/details/44904141
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据结构