Bootstrap

快速排序的三种方式以及快排的优化

一.快速排序的基本思想

关于快速排序,它的基本思想就是选取一个基准,一趟排序确定两个区间,一个区间全部比基准值小,另一个区间全部比基准值大,接着再选取一个基准值来进行排序,以此类推,最后得到一个有序的数列。

二.快速排序的步骤

  • 1.选取基准值,通过不同的方式挑选出基准值。
  • 2.用分治的思想进行分割,通过该基准值在序列中的位置,将序列分成两个区间,在准值左边的区间里的数都比基准值小(默认以升序排序),在基准值右边的区间里的数都比基准值大。
  • 3.递归调用快速排序的函数对两个区间再进行上两步操作,直到调用的区间为空或是只有一个数。

三.关于选取基准值的方式

1.固定位置选取基准值
基本思想:选取第一个或最后一个元素作为基准值。
这里写图片描述
如上是以第一个数作为选取基准的方式的第一趟排序的结果,接着就是对分好的两个区间再进行递归的快排。

但是,这种选取基准值的方法在整个数列已经趋于有序的情况下,效率很低。比如有序序列(0,1,2,3,4,5,6,7,8,9),当我们选取0为基准值的时候,需要将后面的元素每个都交换一遍,效率很低。所以这种以固定位置选取基准值的方式,只适用于该序列本身并不是趋于有序的情况下,比如一串随机数列,此时的效率还能够差强人意。

为了避免这种已经有序的情况,于是有了下面两种选取基准值的方式

下面是关于选取固定基准值快排的代码

int SelectPivot(int* a, int left, int right)//选取基准值函数
{
    return a[left];
}

void QuickSort(int* a, int left, int right)
{
    assert(a);
    int i, j;
    int pivot = SelectPivot(a, left, right);//确定基准值 
    if (left < right)
    {
        i = left + 1;//以第一个数left作为基准数,从left+1开始作比较
        j = right;

        while (i < j)
        {
            if (a[i] > pivot)//如果比较的数比基准数大
            {
                swap(a[i], a[j]);//把该比较数放到数组尾部,并让j--,比较过的数就不再比较了
                j--;
            }
            else
            {
                i++;//如果比较的数比基准数小,则让i++,让下一个比较数进行比较
            }
        }

        //跳出while循环后,i==j
        //此时数组被分成两个部分,a[left+1]-a[i-1]都是小于a[left],a[i+1]-a[right]都是大于a[left]
        //将a[i]与a[left]比较,确定a[i]的位置在哪
        //再对两个分割好的部分进行排序,以此类推,直到i==j不满足条件

        if (a[i] >= a[left]) //这里必须要用>=,否则相同时会出现错误
        {
            i--;
        }

        swap(a[i], a[left]);

        QuickSort(a, left, i);
        QuickSort(a, j, right);
    }
}

//测试函数
int main()
{
    int a[] = { 2,5,4,9,3,6,8,7,1,0};
    const size_t n = sizeof(a) / sizeof(a[0]);
    QuickSort(a, 0, n - 1);
    Print(a, n);
    system("pause");
    return 0;
}

2.随机选取基准
基本思想:选取待排序列中任意一个数作为基准值。
因为快排函数部分的代码是一样的,只是选取基准值部分的函数不相同,下面只附上选取基准值函数的代码

int SelectPivot(int* a, int left, int right)//选取基准值函数
{
    srand((unsigned)time(NULL));
    int pivotPos;
    if (left < right)//这里需要保证传进来的left必须小于left
    {
        pivotPos = rand() % (right - left) + left;
    }
    else
    {
        pivotPos = left;//在递归调用里走到这一步,肯定是left=right,直接让pivotPos=left
    }

    swap(a[pivotPos], a[left]);
    return a[left];
}

引入随机化快速排序的作用,就是当该序列趋于有序时,能够让效率提高,大量的测试结果证明,该方法确实能够提高效率。但在整个序列数全部相等的时候,随机快排的效率依然很低,它的时间复杂度为O(N^2),但出现这种最坏情况的概率非常的低,所以它还是一种效率比较好的方法,一般情况下都能够达到O(N*lgN)。

3.三数取中法选取基准值
基本思想:取第一个数,最后一个数,第(N/2)个数即中间数,三个数中数值中间的那个数作为基准值。举个例子,对于int a[] = { 2,5,4,9,3,6,8,7,1,0};,‘2’、‘3’、‘0’,分别是第一个数,第(N/2)个是数以及最后一个数,三个数中3最大,0最小,2在中间,所以取2为基准值。

下面也是附上三数取中法的代码

int SelectPivot(int* a, int left, int right)//选取基准值函数
{
    int mid;
    if (left < right)
    {
        mid = (right - left) / 2;
    }
    else
    {
        return a[left];//在递归调用里走到这一步,肯定是left=right,直接让pivotPos=left
    }

    if (a[mid] > a[right])
    {
        swap(a[mid], a[right]);
    }
    if (a[left] > a[right])
    {
        swap(a[left], a[right]);
    }
    if (a[mid] > a[left])
    {
        swap(a[mid], a[left]);
    }
    //上面三步完成之后,a[left]就是三个数中最小的那个数
    return a[left];
}

采用三数取中法很好的解决了很多特殊的问题,但对于很多重复的序列,效果依然不好。于是在这三种选取基准值的方法下,另外地还有三种优化方法。

四.快速排序的优化

优化一:当待排序序列的长度分割到一定大小后,使用插入排序。
优化原因:对于待排序的序列长度很小或是基本趋于有序时,快排的效率还是插排好。

自定义截止范围:序列长度N=10。当待排序的序列长度被分割到10时,采用快排而不是插排。

if (n <= 10)//当整个序列的大小n<=10时,采用插排
{
    InsertSort(a, n);
}

优化二:在一次排序后,可以将与基准值相等的数放在一起,在下次分割时可以不考虑这些数。
这里写图片描述

因为这一次改动的代码比较多,所以再继续把所有的代码全部拿出来看一下

int SelectPivot(int* a, int left, int right)//选取基准值函数
{
    int mid;
    if (left < right)
    {
        mid = (right - left) / 2;
    }
    else
    {
        return a[left];//在递归调用里走到这一步,肯定是left=right,直接让pivotPos=left
    }

    if (a[mid] > a[right])
    {
        swap(a[mid], a[right]);
    }
    if (a[left] > a[right])
    {
        swap(a[left], a[right]);
    }
    if (a[mid] > a[left])
    {
        swap(a[mid], a[left]);
    }
    //上面三步完成之后,a[left]就是三个数中最小的那个数
    return a[left];
}

void QuickSort(int* a, int left, int right)
{
    assert(a);
    if (n <= 10)//当整个序列的大小n<=10时,采用插排
    {
        InsertSort(a, n);
        return;
    }
    int i, j;
    int pivot = SelectPivot(a, left, right);//确定基准值 
    if (left < right)
    {
        i = left + 1;//以第一个数left作为基准数,从left+1开始作比较
        j = right;

        while (i < j)
        {
            if (a[i] == pivot)//处理与基准值相等的数,都放到数组末尾
            {
                swap(a[i], a[j]);
                --j;
            }
            else if (a[i] > pivot)//如果比较的数比基准数大
            {
                while (1)
                {
                    if (a[j] == pivot)//如果要换的数值等于基准值,让j--,与前一个交换
                    {
                        --j;
                    }
                    else
                    {
                        break;
                    }
                }
                swap(a[i], a[j]);//把该比较数放到数组尾部,并让j--,比较过的数就不再比较了
                --j;
            }
            else
            {
                ++i;//如果比较的数比基准数小,则让i++,让下一个比较数进行比较
            }
        }

        //跳出while循环后,i==j
        //此时数组被分成两个部分,a[left+1]-a[i-1]都是小于a[left],a[i+1]-a[right]都是大于a[left]
        //将a[i]与a[left]比较,确定a[i]的位置在哪
        //再对两个分割好的部分进行排序,以此类推,直到i==j不满足条件

        if (a[i] >= a[left]) //这里必须要用>=,否则相同时会出现错误
        {
            i--;
        }


        swap(a[i], a[left]);
        int tmp = right;//用tmp表示从后往前第一个不是基准值的数
        while (tmp > i)
        {
            if (a[tmp] == pivot)
            {
                --tmp;
            }
            else//else表示没有与基准值重复的值
            {
                QuickSort(a, left, i - 1);
                QuickSort(a, i + 1, right);
                return;
            }
        }
        int pos = tmp;//因为后面要用到tmp,所以运算的话用一个pos来代替tmp进行运算
        int r = right;//因为后面要保证right还是先前的右边界,所以运算的话用另外一个变量来表示
        int count = 0;
        while (pos > i&&r > tmp)
        {
            swap(a[pos], a[r]);
            --r;
            --pos;
            ++count;//换了一次让count++
        }

        QuickSort(a, left, i-1);//对左区间快排,i-1是左区间的最后一个数
        QuickSort(a, right-count+1, right);//对右区间快排,right-count+1是右区间的第一个数
    }
}

这种聚集与基准值相等的值的优化方法,在解决数据冗余的情况下非常有用,提高的效率也是非常多。

优化三:优化递归操作
快排函数在函数尾部有两次递归操作,我们可以对其使用尾递归优化

优点:如果待排序的序列划分极端不平衡,递归的深度将趋近于n,而栈的大小是很有限的,每次递归调用都会耗费一定的栈空间,函数的参数越多,每次递归耗费的空间也越多。优化后,可以缩减堆栈深度,由原来的O(n)缩减为O(logn),将会提高性能。

只是在尾部的递归调用的时候做了以下改变

while (left < right)
{
    QuickSort(a, left, i - 1);//对左区间快排,i-1是左区间的最后一个数
    left = right - count + 1;
}

其实这种优化编译器会自己优化,相比不使用优化的方法,时间几乎没有减少。

所以到这里,总结一下,对于快速排序(一组随机数组),效率最快的优化方案应该是三数取中法+插排+聚集相等元素,对于尾递归可以有也可以没有,对于效率的变化改变不大。

;