快速排序原理、复杂度分析及C语言实现
本文作者华科小涛:@http://www.cnblogs.com/hust-ghtao/
,参考《算法导论》,代码借用《剑指offer》
快速排序是一种最坏情况时间复杂度为
的排序算法。虽然最坏情况的时间复杂度很差,在在实际应用中是最好的选择,平均性能很好:期望时间复杂度
,而且
隐含的常数因子非常小。另外,它还能够进行原排序,在虚拟环境中也能很好工作。基于随机抽样的快速排序算法,在输入元素互异的情况下,期望运行时间为
。
1.基本思想
快速排序利用了分治策略。分治策略可以分为3个步骤:
- 分解:将问题划分为一些子问题,子问题的形式与原问题一样,只是规模更小。
- 解决:递归的求解出子问题。如果子问题的规模足够小,则停止递归,直接求解。
- 合并:将子问题的解组合成原问题的解。
对一个典型的子数组A[p..r]进行快速排序的分治过程如下:
- 分解:数组A[p..r]被划分为两个(可能为空)子数组A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每一个元素都小于等于A[q],而A[q+1..r]中的每个元素都大于A[q]。其中计算下标q也是划分过程的一部分。
- 解决:通过递归调用快速排序,对子数组A[p..q-1]和A[q+1..r]进行排序。
- 合并:因为子数组都是原址排序的,所以不需要合并操作。
2.详细过程
快速排序的伪代码如下:
,为了排序数组A的全部元素,初始调用QUICKSORT(A, 1, A.length)。
其中最关键的部分就是数组的划分PARTITION,它实现了对子数组A[p..r]的原址重排。伪代码如下:
。
这里的PARTITION程序选择x=A[r]作为主元,并围绕着它来划分数组。
随着程序的增加,数组被划分成4个区域,如下图所示:

其中:
- A[p..i]上的所有值都小于等于x;
- A[i+1..j-1]区间的所有值都大于x;
- A[j..r-1]是还未扫描的元素,可能属于任何一种情况;
- A[r]=x。
指针 i 一直指向小值数组的最后一个元素,j指向大值数组末尾的下一个元素。
PARTITION的一次迭代过程中会出现两种情况:
(a)如果A[j]>x,需要做的只是将j值加1:

(b)A[j]<=x,则将i值加1,并交换A[i]和A[j],在将j值加1,使循环不变量保持不变。
。
在PARTITION的最后,将主元与最左的大于x的元素进行交换,就可以将主元移动到它在数组中的正确位置,并返回主元的新下标。
3.性能分析
快速排序的运行时间依赖于划分是否平衡,而平衡与否又依赖于用于划分的元素。
3.1 最坏情况划分
当划分产生的两个子问题分别包含了n-1个元素和0个元素,这是极不平衡的划分。假设算法的每一次递归都出现了这种不平衡的划分,算法运行时间的递归式可以表示为:

可以解得:
。
所以,如果在算法的每一层递归上,划分都是最大程度不平衡的,那么算法的时间复杂度为:
。
3.2 平均情况
在最平衡的划分中,PARTITION得到的两个子问题的规模都不大于n/2。算法运行时间的递归式为:

可以解得:
。
另外,只要是划分是常数比例的,甚至好的和差(极不平衡)的划分交替出现时,快速排序算法和全是好的划分时一样,仍然是
。
4.随机化版本
在算法中引入随机性,使得算法对所有的输入都能获得较好的期望性能。
从A[p..r]中随机选择一个元素作为主元。为了达到这一目的,首先将A[r]与从A[p..r]随机选择的元素交换。通过对序列p..r随机抽样保证主元素
x=A[r]是等概率从r-p+1个元素中选取的。
下面是RANDOMIZED-PARTITION和RANDOMIZED-QUICKSORT的伪代码:

在使用RANDOMIZED-PARTITION,输入元素互异的情况下,快速排序算法的期望运行时间为
。
6.代码实现
RANDOMIZED-PARTITION:
1: int Partition(int data[], int length, int start, int end)
2: {
3: if (data == NULL||length<=0||start<0||end>=length)
4: {
5: throw new std::exception("Invalid Parameters");
6: }
7: int index = RandomInRange(start, end);
8: Swap(&data[index], &data[end]);
9:
10: int small = start - 1;
11: for (index = start; index < end;++index)
12: {
13: if (data[index] < data[end])
14: {
15: ++small;
16: if (small!=index)
17: {
18: Swap(&data[index], &data[small]);
19: }
20: }
21: }
22: ++small;
23: Swap(&data[small], &data[end]);
24:
25: return small;
26: }
QUICKSORT:
1: void QuickSort(int data[], int length, int start, int end)
2: {
3: if (start == end)
4: {
5: return;
6: }
7: int index = Partition(data, length, start, end);
8: if (index >start)
9: {
10: QuickSort(data, length, start, index-1);
11: }
12: if (index<end)
13: {
14: QuickSort(data, length, index + 1, end);
15: }
16: }

快速排序原理、复杂度分析及C语言实现的更多相关文章
- 八大排序算法——快速排序(动图演示 思路分析 实例代码Java 复杂度分析)
一.动图演示 二.思路分析 快速排序的思想就是,选一个数作为基数(这里我选的是第一个数),大于这个基数的放到右边,小于这个基数的放到左边,等于这个基数的数可以放到左边或右边,看自己习惯,这里我是放到了 ...
- 杨辉三角(Pascal Triangle)的几种C语言实现及其复杂度分析
说明 本文给出杨辉三角的几种C语言实现,并简要分析典型方法的复杂度. 本文假定读者具备二项式定理.排列组合.求和等方面的数学知识. 一 基本概念 杨辉三角,又称贾宪三角.帕斯卡三角,是二项式系数在三 ...
- 数据结构( Pyhon 语言描述 ) — — 第3章:搜索、排序和复杂度分析
评估算法的性能 评价标准 正确性 可读性和易维护性 运行时间性能 空间性能(内存) 度量算法的运行时间 示例 """ Print the running times fo ...
- 基于python语言使用余弦相似性算法进行文本相似度分析
编写此脚本的目的: 本人从事软件测试工作,近两年发现项目成员总会提出一些内容相似的问题,导致开发抱怨.一开始想搜索一下是否有此类工具能支持查重的工作,但并没找到,因此写了这个工具.通过从纸上谈兵到着手 ...
- PHP函数的实现原理及性能分析
前言 在任何语言中,函数都是最基本的组成单元.对于php的函数,它具有哪些特点?函数调用是怎么实现的?php函数的性能如何,有什么使用建议?本文将从原理出发进行分析结合实际的性能测试尝试对这些问题进行 ...
- 快速排序原理及Java实现
1.基本思想: 快速排序是我们之前学习的冒泡排序的升级,他们都属于交换类排序,都是采用不断的比较和移动来实现排序的.快速排序是一种非常高效的排序算法,它的实现,增大了记录的比较和移动的距离,将关键字较 ...
- PHP 基础系列(三) 【转】PHP 函数实现原理及性能分析
作者:HDK (百度) 前言 在任何语言中,函数都是最基本的组成单元.对于PHP的函数,它具有哪些特点?函数调用是怎么实现的?php函数的性能如何,有什么使用建议?本文将从原理出发进行分析结合实际的性 ...
- (转)PHP 函数的实现原理及性能分析
前言 任何语言中,函数都是最基本的组成单元.对于php的函数,它具有哪些特点?函数调用是怎么实现的?php函数的性能如何,有什么使用建议?本文 将从原理出发进行分析结合实际的性能测试尝试对这些问题进行 ...
- 重拾算法之复杂度分析(大O表示法)
.katex { display: block; text-align: center; white-space: nowrap; } .katex-display > .katex > ...
随机推荐
- 10_9 java笔记
java中所有的关键字都是小写的注意main虽然被编译器识别,但是它并不是关键字包:(名字小写) 单级包:liyi 多级包:cn.itcast path 和classpath的区别:path环境变量里 ...
- emacs打开乱码解决办法
前言:有时候我们使用emacs打开文件的时候,因为emacs默认编码跟文档编码不同而出现了乱码如图: 对于新手的我们应该通过以下两种途径来解决: 方法一: 只需C-x <RET> r ( ...
- PHP学习笔记8-文件操作
在data文件中写入数据: <?php /** * Created by PhpStorm. * User: Administrator * Date: 2015/6/29 * Time: 17 ...
- CodeForces 22B Bargaining Table 简单DP
题目很好理解,问你的是在所给的图中周长最长的矩形是多长嗯用坐标(x1, y1, x2, y2)表示一个矩形,暴力图中所有矩形易得递推式:(x1, y1, x2, y2)为矩形的充要条件为: (x1, ...
- 0x3f3f3f3f...编程中无穷大常量的设置技巧
转自 http://aikilis.tk/ 如果问题中各数据的范围明确,那么无穷大的设定不是问题,在不明确的情况下,很多程序员都取0x7fffffff作为无穷大,因为这是32-bit int的最大值. ...
- Chapter 13 建造者模式
建造者模式又叫生成器模式:将一个产品的内部表象与产品的生成过程分割开来,从而可以使一个建造过程生成具有不同的内部表象的产品对象. 代码: package xiao; import java.util. ...
- 用4bit的counter看同步复位与异步复位
先看看这个同步复位 //date: 2013/8/20 //designer :pengxiaoen module counter_4 ( clock,reset, out ); input rese ...
- Winsock在Windows下的编程教程(C语言)(图文并茂,超长教程)
https://www.0xaa55.com/forum.php?mod=viewthread&tid=378&extra=page%3D2
- Oracle Dedicated server 和 Shared server(专用模式 和 共享模式) 说明(转)
一. 官网说明 在DBCA 建库的时候,有提示让我们选择连接类型,这里有两种类型:专用服务器模式和共享服务器模式.默认使用专用模式.如下图: Oracle 官方文档对这两种文档的说明如下: Abou ...
- VC命令行编译参数介绍
CL.exe是控制Microsoft C和C++编译器与链接器的32位工具.编译器产生通用对象文件格式(COFF)对象(.obj)文件.链接器产生可执行文件(.exe)或动态链接库文件(DLL). 注 ...