发明者:Sir Charles Antony Richard Hoare

基本思想:

  • 先对数据进行洗牌(Shuffle the array)
  • 以数据a[j]为中心进行分区(Partition),使得a[j]左侧的数据都小于等于a[j],a[j]右侧的数据都大于等于a[j]

  • 分区完后递归排序

分区演示(partitioning demo)

重复操作指导i和j指针相遇

  • 当a[i] < a[lo]时,令i从左往右扫描
  • 当a[j] > a[lo]时,令j从右往左扫描
  • 交换a[i]和a[j]

当指针相遇时

  • 交换a[lo]和a[j]

Java实现

public class Quick
{
private static int partition(Comparable[] a, int lo, int hi)
{
int i = lo, j = hi + 1;
while (true)
{
while (less(a[++i], a[lo]))
if (i == hi) break; // 从左向右找到不小于a[lo]的元素 while (less(a[lo], a[--j]))
if (j == lo) break; // 从右向左找到不大于a[lo]的元素 if (i >= j) break; // 指针相遇
exch(a, i , j); // 交换 } exch(a, lo, j); // 和比较元素交换
return j; // 返回比较元素所在的下标
} public static void sort(Comparable[] a)
{
StdRandom.shuffle(a); // 先对数组进行洗牌,复杂度是N
sort(a, 0, a.length - 1);
} private static void sort(Comparable[] a, int lo, int hi)
{
if (hi <= lo) return;
int j = partition(a, lo, hi);
sort(a, lo, j-1);
sort(a, j+1, hi);
}
}

实现细节(implementation details)

  • 原地分区(Partitioning in-place):不用开辟额外的辅助数组
  • 终止循环:检查两个指针是否相遇
  • 边界:(j == lo)的检查是多余的,但(i == hi)的检查是必要的
  • 保留随机性(Preserving randomness):需要洗牌(Shuffling)来保证运动(Performance guarantee)
  • 相同的值(Equal keys):当存在重复的元素,最好将指针停在和比较元素相同的位置上(When duplicates are present, it is (counter-intuitively) better to stop on keys equal to the partitioning item's key.)

复杂度平均情况分析(average-case analysis):平均复杂度为 1.39NlgN,比归并排序还快

运行特征(Performance characteristic)

  • 最坏情况(Worst case):1/2*N^2

    • 几乎不会出现
  • 平均情况(Average case):比较次数约等于1.39NlgN
    • 比归并排序多出39%的比较次数
    • 但是由于更少的数据交换,实际中比归并排序更快
  • 随机洗牌(Random shuffle):  
    • 对最坏情况的概率性保证(Probabilistic guarantee)
    • 经过实验验证的数学模型的基础(Basic for math model that can be validated with experiments.)
  • 留心:出现以下情况时,运算是平方级的(quadratic)
    • 当数组逆序排列
    • 当存在多个重复元素   

特性(Properties):

  • 快速排序是一种原地排序算法(in-place sorting algorithm)
  • 不具有稳定性

实践上的改善(practical improvements)

改善1:使用插入排序对小的子序列进行排序

  • 即使是快速排序,也对小数组有不少的开销
  • 当数组大小达到10时,停止(Cutoff)插入排序
  • 大概有20%的改善
private static void sort(Comparable[] a, int lo, int hi)
{
if (hi <= lo + CUFOFF -1)
{
Insertion.sort(a, lo, hi);
return;
}
int j = partition(a, lo, hi);
sort(a, lo, j-1);
sort(a, j+1, hi);
}

改善2:使用平均数作为比较元素

  • 最好的选择是比较元素刚好是中值
  • 通过取样估计中值(Estimate true median by taking median of sample.)
  • 对三个取样元素取平均值
  • 大概有10%的改善
private static void sort(Comparable[] a, int lo, int hi)
{
if (hi <= lo) return; int m = medianOF3(a, lo, lo + (hi - lo)/2, hi);
swap(a, lo, m); int j = partition(a, lo, hi);
sort(a, lo, j-1);
sort(a, j+1, hi);
}

普林斯顿大学算法课 Algorithm Part I Week 3 快速排序 Quicksort的更多相关文章

  1. 普林斯顿大学算法课 Algorithm Part I Week 3 排序算法复杂度 Sorting Complexity

    计算复杂度(Computational complexity):用于研究解决特定问题X的算法效率的框架 计算模型(Model of computation):可允许的操作(Allowable oper ...

  2. 普林斯顿大学算法课 Algorithm Part I Week 3 归并排序 Mergesort

    起源:冯·诺依曼最早在EDVAC上实现 基本思想: 将数组一分为(Divide array into two halves) 对每部分进行递归式地排序(Recursively sort each ha ...

  3. 普林斯顿大学算法课 Algorithm Part I Week 3 排序的应用 System Sorts

    排序算法有着广泛的应用 典型的应用: 排序名称 排序MP3音乐文件 显示Google的网页排名的搜索结果 按标题顺序列出RSS订阅 排序之后下列问题就变得非常简单了 找出中位数(median) 找出统 ...

  4. 普林斯顿大学算法课 Algorithm Part I Week 3 重复元素排序 - 三路快排 Duplicate Keys

    很多时候排序是为了对数据进行归类,这种排序重复值特别多 通过年龄统计人口 删除邮件列表里的重复邮件 通过大学对求职者进行排序 若使用普通的快排对重复数据进行排序,会造成N^2复杂度,但是归并排序和三路 ...

  5. 普林斯顿大学算法课 Algorithm Part I Week 3 求第K大数 Selection

    问题 给定N个元素的数组,求第k大的数. 特例当k=0时,就是求最大值,当k=N-1时,就是求最小值. 应用顺序统计求top N排行榜 基本思想 使用快速排序方法中的分区思想,使得a[k]左侧没有更小 ...

  6. 普林斯顿大学算法课 Algorithm Part I Week 3 排序稳定性 Stability

    稳定性(Stability):先按性质A排序,再按性质B排序,性质B相同的那些项是否仍然是按性质A排序的? 一个稳定的排序,相同值的元素应仍保持相对顺序(relative order) 稳定的算法:插 ...

  7. 普林斯顿大学算法课 Algorithm Part I Week 3 自我总结

    要熟练掌握比较器Comparator public final Comparator<T> MY_COMPARATOR = new myComparator(); //定义比较器 .... ...

  8. 普林斯顿大学算法课 Algorithm Part I Week 3 比较器 Comparators

    比较器接口(Comparator interface):用可选顺序(alternate order)进行排序 public interface Comparator<key> int co ...

  9. 普林斯顿大学算法课 Algorithm Part I 学习资源

    网友笔记参考 果壳Mooc首页 revilwang的专栏 白色咖啡 Weiran Liu的渣技术小专栏 Bug表:http://findbugs.sourceforge.net/bugDescript ...

随机推荐

  1. 多线程 NSThread GCD

    ios多线程实现种类 NSThread NSOperationQueue NSObject GCD *************** 1.NSThread //线程 第一种 NSThread *thre ...

  2. 一步一步学python(三) - 使用字符串

    1.基本字符串操作 序列和元组的索引.分片.乘法.判断成员资格.求长度.取最小值和最大值对字符串同样适用. 字符串是不可变的 2.字符串格式化 %左侧放字符串右侧放格式化的值.一般情况下使用元组 fo ...

  3. createDocumentFragment

    http://www.cnblogs.com/myjavascript/p/3708920.html 对于循环批量操作页面的DOM有很大帮助!利用文档碎片处理,然后一次性append,并且使用原生的j ...

  4. linux系统怎么改为中文版(转)

    linux系统安装好后怎么改为中文版呢?今天就跟大家介绍下linux系统改为中文版的方法,希望能帮助到大家! 以下是linux系统改为中文版的四种方法,一起来看看: 方法1:写入环境变量 echo & ...

  5. URL组成介绍

    1.2. HTTP request ----------------- First, let's consider this HTTP request : Line Contents number 1 ...

  6. Unix/Linux环境C编程入门教程(27) 内存那些事儿

    calloc() free() getpagesize() malloc() mmap() munmap()函数介绍 calloc(配置内存空间) 相关函数 malloc,free,realloc,b ...

  7. 【思考题】CSDN第四届在线编程大赛2014初赛:带通配符的数

    题目要求: 输入参数:参数A,含有任意个数的?的数值字符串,如:12?4,?代表一位任意数                     参数B,不含?的数值字符串,长度与参数A一致 输出结果:参数A比参数 ...

  8. 基础巩固(二)- log4j的使用

    日志是应用软件中不可缺少的部分,Apache的开源项目log4j是一个功能强大的日志组件,提供方便的日志记录.在apache网站:jakarta.apache.org/log4j 可以免费下载到Log ...

  9. HDU1879 继续畅通工程 (并查集)

    继续畅通工程 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Subm ...

  10. poj 1050 To the Max_dp求最大子矩阵和

    题意:求最大子矩阵和 利用dp[i]每次向下更新,构成竖起的单条矩阵,再按不小于零就加起来来更新,构成更大的矩阵 #include <iostream> #include<cstdi ...