您的位置:首页 > 其它

快速排序改进

2016-03-30 22:05 183 查看
快速排序平均复杂度为O(nlgn)

最坏情况为O(n^2),即数组已经有序或大致有序的情况下,每次划分只能减少一个元素,快速排序将不幸退化为冒泡排序,所以快速排序时间复杂度下界为O(nlogn),最坏情况下为O(n^2)

1.如果在排序时选取最后一个元素为基准,则可以通过以下方法来避免划分的不平衡。

int Patition(int *pnArr, int nLeft, int nRight)
{
int nKey = nRight;
int i = nLeft - 1;
bool bExchange = false;

for (int j = nLeft; j < nRight; j++)
{
if (pnArr[j] < pnArr[nKey])
{
i++;
Swap(&pnArr[i], &pnArr[j]);
bExchange = true;
}
}
Swap(&pnArr[i+1],&pnArr[nRight]);
if (bExchange)
{
return i+1;
}
else
{
return (nLeft + nRight) / 2;
}
}


即设置一个标志标示在划分过程中有没有交换元素,如果没有交换元素就返回数组中间的元素,这样就可以避免最坏情况。

2.但是上面的改进只适合选取最后一个元素,如果对于一个有序序列,选取中间元素为基准,则把中间的元素交换到最后还是会又一次交换的过程,不能改善。(改善方法可以同下面的随机选取元素方法一样设置阈值).

3.快速排序的最坏情况基于每次划分对基准元素的选择。基本的快速排序选取第一个元素作为基准元素。这样在数组已经有序的情况下,每次划分将得到最坏的结果。一种比较常见的优化方法是随机化算法,即随机选取一个元素作为基准元素。这种情况下虽然最坏情况仍然是O(n^2),但最坏情况不再依赖于输入数据,而是由于随机函数取值不佳。实际上,随机化快速排序得到理论最坏情况的可能性仅为1/(2^n)。所以随机化快速排序可以对于绝大多数输入数据达到O(nlogn)的期望时间复杂度。

4.设置阈值。快速排序的实现需要消耗递归栈的空间,而大多数情况下都会通过使用系统递归栈来完成递归求解。在元素数量较大时,对系统栈的频繁存取会影响到排序的效率。

一种常见的办法是设置一个阈值,在每次递归求解中,如果元素总数不足这个阈值,则放弃快速排序,调用一个简单的排序过程完成该子序列的排序。这样的方法减少了对系统递归栈的频繁存取,节省了时间的消费。

一般的经验表明,阈值取一个较小的值,排序算法采用选择、插入等紧凑、简洁的排序。一个可以参考的具体方案:阈值T=10,排序算法用选择排序。阈值不要太大,否则省下的存取系统栈的时间,将会被简单排序算法较多的时间花费所抵消。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: