数据结构与算法之--高级排序:shell排序和快速排序
高级排序比简单排序要快的多,简单排序的时间复杂度是O(N^2),希尔(shell)排序大约是O(N*(logN)^2),而快速排序是O(N*logN)。
说明:下面以int数组的从小到大排序为例。
希尔(shell)排序
希尔排序是基于插入排序的,首先回顾一下插入排序,假设插入是从左向右执行的,待插入元素的左边是有序的,且假如待插入元素比左边的都小,就需要挪动左边的所有元素,如下图所示:
==>
图1和图2:插入右边的temp柱需要outer标记位左边的五个柱子都向右挪动
如图3所示,相比插入排序,希尔排序是这样做的:对固定间隔的元素做插入排序,然后减小间隔,重复做插入排序,直到间隔减小为1。
==> 
图3和图4: outer位置和inner-h位置的柱子做插入排序
数据量大的图形看这个过程更容易形象地把握算法特点,如图5和6,总元素数量等于100:

图5和图6:间隔分别为40和13执行完插入排序后的效果
相比简单插入排序,大间隔地做插入排序有两个好处:
一、大间隔直接导致需要挪动的数据稀少,且数据挪动的效率高,图5中一次挪动可以跨越40个位置;
二、经过前一步大间隔的插入排序后,整个数组从整体上粗略地看已经有了明显的顺序,后一步小间隔的插入排序时,一部分操作是不需要挪动数据的,再次减少了挪动数据的次数。
间隔的序列:间隔的常用序列,通过递归表示:h=3*h+1。(1,4,13,40,121 ...)
希尔排序的效率:“没有理论上分析希尔排序的效率的结论,各种基于实验的评估,估计它的时间级从O(N^(3/2))到O(N^(7/6))”--[1]。
参考代码:
/**
* Shell排序可以说是插入排序的升级版,相比较插入排序,
* Shell排序首先使用大间隔、少元素的插入排序,使得每次移动的数据少,但是移动的跨度大;
* 然后再使用小间隔,略多数量元素的插入排序,经过上一步插入排序,很多数据已经距离排序位置不远了,
* 这样第二次插入排序时,需要移动的数据的数量就会减少,
* 间隔最终减小到1.
*/
public static int[] shellSort(int[] input) {
int length = input.length;
int inner, outer;
int temp; int h = 1;
while (h <= length / 3) {
h = h * 3 + 1;
} while (h > 0) {
for (outer = h; outer < length; outer++) {
temp = input[outer];
inner = outer; while (inner > h - 1 && input[inner - h] >= temp) {
input[inner] = input[inner - h];
inner -= h;
}
input[inner] = temp;
}
h = (h - 1) / 3;
} return input;
}
快速排序
快速排序算法的策略是这样的:首先把数组用某个值分为两个子数组,且称这个值为分组值,一个子数组中的元素均小于分组值,另一子数组则均大于等于分组值,这里的子组内并不排序;然后,再分别对两个子组进行再分组,重复递归这个过程,直到最后每两个元素作为一组进行再分组,整个数组就排好序了。
分组过程具体如下:同时从左往右和从右往左扫描数组,记扫描标记位为LP和RP。在LP一边,若发现元素小于分组值则跳过(即向右移动一位检查下一个元素),否则等待RP的扫描;RP若发现元素大于等于分组值跳过,直到找到小于分组值的元素,然后LP和RP位置的元素交换,重复这个过程,直到LP和RP相遇。
如图7,8所示,以11号元素为分组值,LP停在0号位置,RP跳过10号,停在图7中的9号位置(粉色柱),然后0号和9号交换,后续重复这个过程。
=> 
图7和图8:以11号柱作为分组值,0号和9号柱子将交换

图9:100个元素的数组经过两次分组后的效果
分组值的选择,可以想见,理想的分组值应该是待分组元素的中值,这样分组后子组在数量少几乎是一半对一半,不过找中值无疑增加了算法的工作量。图7中采用了更简单的方式,直接选数组最右边的元素为分组值,分组结束后,再把这个值交换到LP和RP相遇的位置,假如初始数组是从大到小排序的,这种情况下,选择最右边的元素作为分组值,其区分度就很差了。更好用的方法是所谓的取首尾中三项数据的中值或者平均值。
通过对算法过程的描述可知,其时间复杂度应该为:O(N*logN),比简单排序和希尔排序都要快。
参考程序如下:
/**
* Time Complexity: O(N*logN)
*/
public static void quickSort(int[] input, final int left, final int right) {
if (left < right) {
int partition = partition(input, left, right);
quickSort(input, left, partition - 1);
quickSort(input, partition, right);
}
} public static int median(int i1, int i2, int i3) {
int[] arrTmp = {i1, i2, i3};
int min = arrTmp[0];
int max = arrTmp[0];
for (int i = 1; i < arrTmp.length; i++) {
min = min < arrTmp[i] ? min : arrTmp[i];
max = max > arrTmp[i] ? max : arrTmp[i];
}
return (i1 + i2 + i3) - min - max;
} public static int partition(int[] input, final int left, final int right) {
final int mid = (left + right) / 2;
int pivotValue = median(input[left], input[mid], input[right]); int leftPtr = left;
int rightPtr = right;
while (leftPtr < rightPtr) {
if (input[leftPtr] < pivotValue) {
leftPtr++;
continue;
}
if (input[rightPtr] > pivotValue) {
rightPtr--;
continue;
}
int temp = input[leftPtr];
input[leftPtr] = input[rightPtr];
input[rightPtr] = temp;
leftPtr++;
rightPtr--;
} // 找出大于pivotalValue的第一个值的位置。
if (input[rightPtr] > pivotValue) {
return rightPtr;
} else {
return rightPtr + 1;
}
}
参考文献
【1】Java数据结构与算法 Rober Lafore 2nd
说明: 文中的图片来自文献【1】附带的Java applet演示小程序。
数据结构与算法之--高级排序:shell排序和快速排序的更多相关文章
- 数据结构和算法 – 11.高级排序算法(上)
对现实中的排序问题,算法有七把利剑可以助你马道成功. 首先排序分为四种: 交换排序: 包括冒泡排序,快速排序. 选择排序: 包括直接选择排序,堆排序. 插入排序 ...
- 为什么我要放弃javaScript数据结构与算法(第十章)—— 排序和搜索算法
本章将会学习最常见的排序和搜索算法,如冒泡排序.选择排序.插入排序.归并排序.快速排序和堆排序,以及顺序排序和二叉搜索算法. 第十章 排序和搜索算法 排序算法 我们会从一个最慢的开始,接着是一些性能好 ...
- Java数据结构和算法总结-冒泡排序、选择排序、插入排序算法分析
前言:排序在算法中的地位自然不必多说,在许多工作中都用到了排序,就像学生成绩统计名次.商城商品销量排名.新闻的搜索热度排名等等.也正因为排序的应用范围如此之广,引起了许多人深入研究它的兴趣,直至今天, ...
- 数据结构-排序-shell排序
shell排序 首先,希尔排序适用于待排序列关键有序. 接下来一步步图解SHELL排序 我为了方便理解内部操作.我先把代码输出整理下. #include<iostream> #includ ...
- 数据结构与算法——认识O(NlogN)的排序(2)
输入整型数组和排序标识,对其元素按照升序或降序进行排序 (一组测试用例可能会有多组数据) 接口说明 原型: void sortIntegerArray(Integer[] pIntegerArray, ...
- 数据结构与算法——认识O(NlogN)的排序(1)
归并排序 1) 整体就是一个简单递归,左边排好序.右边排好序.让其整体有序 2) 让其整体有序的过程里用了外排序方法 3) 利用master公式来求解时间复杂度 4) 归并排序的实质 时间复杂度0(N ...
- 数据结构与算法——常用高级数据结构及其Java实现
前文 数据结构与算法--常用数据结构及其Java实现 总结了基本的数据结构,类似的,本文准备总结一下一些常见的高级的数据结构及其常见算法和对应的Java实现以及应用场景,务求理论与实践一步到位. 跳跃 ...
- php面试题之二——数据结构和算法(高级部分)
二.数据结构和算法 1.使对象可以像数组一样进行foreach循环,要求属性必须是私有.(Iterator模式的PHP5实现,写一类实现Iterator接口)(腾讯) <?php class T ...
- 数据结构和算法 – 11.高级排序算法(下)
三.选择类排序 3.1.简单选择排序 http://www.cnblogs.com/tangge/p/5338734.html#XuanZe 3.2 堆排序 要知道堆排序,首先要了解一下二叉树的模型. ...
随机推荐
- 使用 Intel HAXM 为eclipse安卓模拟器加速
一.下载haxm安装 https://software.intel.com/zh-cn/android/articles/intel-hardware-accelerated-execution-ma ...
- input file上传图片预览,非插件
Input标签 <input type="file" name="pic" onchange="changepic(this)" mu ...
- Hdu3579 Hello Kiki
Hello Kiki Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total ...
- maven的tomcat插件如何进行debug调试
利用maven来部署工程时,一般采用的是tomcat插件,使项目在tomcat上面运行,那么这个debug调试是如何进行呢? 我们在调试的时候问题: 会提示找不到资源,那么如何进行修改呢,方法两个: ...
- mysql按月统计六个月内不同类型订单的成交金额
mysql按月统计六个月内不同类型订单的成交金额 创建数据库 CREATE DATABASE test; 创建订单表 CREATE TABLE `t_order` ( `id` ) NOT NULL ...
- ZooKeeper开发者指南(五)
引言 这个文档是为了想利用ZooKeeper的协调服务来创建分布式应用的开发者提供的指南.它包括概念和实践的信息. 这个文档的一开始的的四部分呈现了不同ZooKeeper高级概念的的讨论.理解Zook ...
- 2015/9/10 Python基础(11):错误和异常
程序在执行的过程中会产生异常,出现错误在以前的一个时期是致命的,后来随着程序的发展,使得一些错误的处理方式是柔和的,发生错误会产生一些错误的诊断信息和一些模糊的提示.帮助我们来处理异常.今天将学习Py ...
- Moq 和 RhinoMocks
我们在做单元测试的时候,利用mock可轻松构建出测试需要的类或接口,而不需要编写繁琐的测试代码. .net 下我知道Moq与Rhino Mocks这两个框架. Moq 网上介绍的比较多. Rhino ...
- 【洛谷 P2513】 [HAOI2009]逆序对数列(DP)
题目链接 这种求方案数的题一般都是\(dp\)吧. 注意到范围里\(k\)和\(n\)的范围一样大,\(k\)是完全可以更大的,到\(n\)的平方级别,所以这暗示了我们要把\(k\)写到状态里. \( ...
- 阅读关于DuReader:百度大规模的中文机器阅读理解数据集
很久之前就得到了百度机器阅读理解关于数据集的这篇文章,今天才进行总结!.... 论文地址:https://arxiv.org/abs/1711.05073 自然语言处理是人工智能皇冠上的明珠,而机器阅 ...