计数排序(counting-sort)—

1. 比较排序算法的下界

(1) 比较排序

到目前为止，我们已经介绍了几种能在O(nlgn)时间内排序n个数的算法：归并排序和堆排序达到了最坏情况下的上界；快速排序在平均情况下达到该上界。

如果仔细观察，我们会发现：在排序的最终结果中，各元素之间的次序依赖于它们之间的比较。我们把这类排序算法统称为比较排序。到目前为止我们介绍的排序算法都是比较排序。下面我们来论证一个事实：任何比较排序算法在最坏情况下都要经过Ω(n lgn)次比较。

(2) 决策树模型

在证明之前，我们先介绍一种由比较排序抽象而来的决策树模型。决策树是一棵完全二叉树，它可以表示在给定输入规模情况下，某一特定排序算法对所有元素的比较操作，而控制，数据移动等操作都被忽略了。如下图，它显示的是插入排序算法作用于包含三个元素的输入序列的决策树情况。

(3) 最坏情况下的下界

从决策树中我们可以看出：从根结点到任意一个可到达叶结点之间的最长简单路径的长度，表示的就是对应排序算法中最坏情况下的比较次数。因此，一个比较排序算法中的最坏情况的排序次数就等于决策树的高度。并且，当决策树中所有排列都是以可到达的叶结点的形式出现时，该决策树高度的下界也就是比较排序算法运行时间的下界。下面我们正式给出证明。

考虑一棵高度为h，具有l个可到达叶结点的决策树。它对应一个对n个元素进行的比较排序。因为输入数据有n！种可能的排列都是叶结点，所以n！≤l。由于在一棵高度为h的二叉树中，叶结点的数目不多于2^h，我们得到：

n! ≤ l ≤ 2^h，

两边取对数得：

h ≥ lg(n!) = Ω(nlgn)

2. 计数排序

我们先假设待排序序列各元素均在区间[0, k]上。

计数排序的思想是：在待排序序列中，如果我们能统计出有多少元素小于或等于某一个元素，我们也就知道了该元素的正确位置。例如，对于待排序序列{2,5,3,0,2,3,0,3}，我们统计出有8个元素小于等于5（包括5自己），那么5这个元素就应该被排序到第8位。

下面给出算法的伪代码描述：

其中数组A[1~n]是待排序数组；数组B[1~n]用来存放已排好序的元素。C[0~k]用来存放上面所说的统计数（具体的说C[i]就表示在数组A中，小于或等于i的元素的总个数）。

下面这幅图描述的是对序列{2,5,3,0,2,3,0,3}排序的过程：

下面我们给出算法的Java实现代码：

public static void main(String[] args) {

	int[] array = { 2, 5, 3, 0, 2, 3, 0, 3 };

	printArray(countingSort(array, 5));

}

/**

 * 计数排序

 *

 * @param array

 *            待排序数组(假定各元素的范围是0~max，包括0和max)

 * @param max

 *            待排序数组中的最大值

 */

public static int[] countingSort(int[] array, int max) {

	int[] result = new int[array.length];

	int[] temp = new int[max + 1];

	// 以下循环操作完成后，temp的第i个位置保存着array中，值为i的元素的总个数

	for (int i : array) {

		temp[i]++;

	}

	// 以下循环操作完成后，temp的第i个位置保存着array中，值小于或等于i的元素的总个数

	for (int i = 1; i < temp.length; i++) {

		temp[i] += temp[i - 1];

	}

	for (int i = array.length - 1; i > -1; i--) {

		result[temp[array[i]] - 1] = array[i];

		temp[array[i]]--;

	}

	return result;

}

/**

 * 打印数组

 */

public static void printArray(int[] array) {

	for (int i : array) {

		System.out.print(i + " ");

	}

	System.out.println();

}

3. 算法分析

我们现在来分析计数排序的时间代价。

在伪代码中，第2~3行时间代价θ(k)；第4~5行时间为θ(n)；第7~8行时间为θ(k)，第10~12行时间为θ(n)。因此，总的运行时间是θ(k+n)。当k= O(n)时，运行时间为θ(n)。

可以看出，计数排序的下界优于我们上面论证的比较排序算法的下界时间Ω(nlgn)。这是因为计数排序并不是比较排序算法。事实上，在代码中从未出现比较某两个元素大小的代码。相反，计数排序是使用输入元素的实际值来确定其在数组中的位置。此时，比较排序算法的模型对计数排序不再适用。

计数排序(counting-sort)——算法导论(9)的更多相关文章

《算法导论》——计数排序Counting Sort
今天贴出的算法是计数排序Counting Sort.在经过一番挣扎之前,我很纠结,今天这个算法在一些scenarios,并不是最优的算法.最坏情况和最好情况下,时间复杂度差距很大. 代码Countin ...
计数排序/Counting Sort
计数排序的算法思想: 对于每一个元素x,只要确定了元素x有多少个比它小的元素,那么就可以知道其最终的位置. 记输入数组为A[n],存放最后排序输出的数组为B[n],提供临时存储空间的中间数组记为C[k ...
计数排序Counting sort
注意与基数排序区分,这是两个不同的排序计数排序的过程类似小学选班干部的过程,如某某人10票,作者9票,那某某人是班长,作者是副班长大体分两部分,第一部分是拉选票和投票,第二部分是根据你的票数入桶 ...
地精排序(Gnome Sort) 算法
gnome应该是最简单排序的排序算法吧!Gnome Sort,这是该算法的作者命名的,O(n*n)时间复杂度,O(1)空间复杂度,属于稳定的排序算法.算法的思想是每趟循环找到第一个逆序的元素,把它和在 ...
转载从最简单的vector中sort用法到自定义比较函数comp后对结构体排序的sort算法
转载自:http://www.cnblogs.com/cj695/p/3863142.html sort函数在使用中非常好用,也非常简单,而且效率与冒泡或者选择排序不是一个数量级.本文就sort函数在 ...
【转】从最简单的vector中sort用法到自定义比较函数comp后对结构体排序的sort算法
sort函数在使用中非常好用,也非常简单,而且效率与冒泡或者选择排序不是一个数量级.本文就sort函数在vector中的用法分为sort函数入门用法与自定义comp比较函数比较结构体这两个最基本的功能 ...
从最简单的vector中sort用法到自定义比较函数comp后对结构体排序的sort算法
sort函数在使用中非常好用,也非常简单,而且效率与冒泡或者选择排序不是一个数量级.本文就sort函数在vector中的用法分为sort函数入门用法与自定义comp比较函数比较结构体这两个最基本的功能 ...
【C++】从最简单的vector中sort用法到自定义比较函数comp后对结构体排序的sort算法
sort函数在使用中非常好用,也非常简单,而且效率与冒泡或者选择排序不是一个数量级.本文就sort函数在vector中的用法分为sort函数入门用法与自定义comp比较函数比较结构体这两个最基本的功能 ...
跳跃空间（链表）排序选择排序(selection sort)，插入排序(insertion sort)
跳跃空间(链表)排序选择排序(selection sort),插入排序(insertion sort) 选择排序(selection sort) 算法原理:有一筐苹果,先挑出最大的一个放在最后,然后 ...
【算法导论】【排序】—— 计数排序（counting sort）
计数排序的特点: 需要额外的数组以存储: 中间过程数据(记为数组 C),数组 C 的下标是待排序序列的元素值,下标对应的值为出现的次数: 排序后的序列(记为 B),计数排序仅获取原始待排序序列的值,对 ...

随机推荐

mysql每秒最多能插入多少条数据 ? 死磕性能压测
前段时间搞优化,最后瓶颈发现都在数据库单点上. 问DBA,给我的写入答案是在1W(机械硬盘)左右. 联想起前几天infoQ上一篇文章说他们最好的硬件写入速度在2W后也无法提高(SSD硬盘) 但这东西感 ...
关于自己写C++的一点风格
现在,我学了很长时间的C++,但是自己就是无法精通.许多知识是入门书上没有的.现在写C++最重要的就是风格问题. 我现在的C++风格: 把自己所有的东西都放在一个名称空间下. 没有全局的函数,有的函数 ...
iOS开源项目周报0105
由OpenDigg 出品的iOS开源项目周报第四期来啦.我们的iOS开源周报集合了OpenDigg一周来新收录的优质的iOS开发方面的开源项目,方便iOS开发人员便捷的找到自己需要的项目工具等. He ...
0.Win8.1，Win10，Windows Server 2012 安装 Net Framework 3.5
后期会在博客首发更新:http://dnt.dkill.net 网站部署之~Windows Server | 本地部署:http://www.cnblogs.com/dunitian/p/482280 ...
MVC Core 网站开发（Ninesky） 2、栏目
栏目是网站的常用功能,按照惯例栏目分常规栏目,单页栏目,链接栏目三种类型,这次主要做添加栏目控制器和栏目模型两个内容,控制器这里会用到特性路由,模型放入业务逻辑层中(网站计划分数据访问.业务逻辑和We ...
Android业务组件化之现状分析与探讨
前言: 从个人经历来说的话,从事APP开发这么多年来,所接触的APP的体积变得越来越大,业务的也变得越来越复杂,总来来说只有一句话:这是一个APP臃肿的时代!所以为了告别APP臃肿的时代,让我们进入一 ...
UWP开发之Mvvmlight实践九：基于MVVM的项目架构分享
在前几章介绍了不少MVVM以及Mvvmlight实例,那实际企业开发中将以那种架构开发比较好?怎样分层开发才能节省成本? 本文特别分享实际企业项目开发中使用过的项目架构,欢迎参照使用!有不好的地方欢迎 ...
ASP.Net MVC4+Memcached+CodeFirst实现分布式缓存
ASP.Net MVC4+Memcached+CodeFirst实现分布式缓存 part 1:给我点时间,允许我感慨一下2016年正好有时间,总结一下最近使用的一些技术,也算是为2016年画上一个完 ...
css选择器
常用css选择器,希望对大家有所帮助,不喜勿喷. 1.*:通用选择器 * { margin: 0; padding: 0; } 选择页面上的全部元素,通常用于清除浏览器默认样式,不推荐使用. 2.#i ...
python之类介绍
python对象销毁(垃圾回收): 1>同Java语言一样,python使用了引用计数这一简单计数来追踪内存中的对象,也就是说,python内部记录着所有使用中的对象各有多少引用,一个内部跟踪变 ...

计数排序(counting-sort)——算法导论(9)

计数排序(counting-sort)——算法导论(9)的更多相关文章

随机推荐

热门专题