深入浅出数据结构C语言版（16）—

　　从这一篇博文开始，我们将开始讨论排序算法。所谓排序算法，就是将给定数据根据关键字进行排序，最终实现数据依照关键字从小到大或从大到小的顺序存储。而这篇博文，就是要介绍一种简单的排序算法——插入排序（Insertion Sort）。

　　为了使精力专注于排序算法本身，而不是对数据的分析、处理，若无特殊说明，我们每一篇介绍排序算法的博文，均做如下假定：

　　1.数据存储于一个数组之中，且数据个数N即数组大小

　　2.数据类型即int

　　3.排序目标为从小到大

　　那么，插入排序是怎样的算法呢？其实插入排序的思想来源就是“插队”。

　　首先我们想象一下这个现实场景：有一个长度为n的队伍，队伍中每个人都比前面的人要高，你是新来的第n+1个人，现在位于队尾，请问你该怎么找到自己应处的位置，以使得队伍保持原有顺序（从矮到高）？

　　这个问题所有人都会解，那就是：我与前一个人比较，若我更矮，则我站到他前面，持续此比较直至我比我前面的人高或同样高，或者我来到第一名为止。

　　这个问题的解法，就是插入排序的根本。

　　现在我们将场景转换到数组中：有一个大小为n的int型数组a，a[0]至a[n-2]已按从小到大排好序，但是第a[n-1]即最后一个元素是“新来的”，现在要将新元素放到正确的位置上，以使得数组保持从小到大的顺序，该怎么做？

　　同样的，我们令新元素不断地与前一个元素比较，若小于前一个元素则两者交换位置，直至新元素大于等于前一个元素，或新元素到达a[0]时停止。

void unfinishedInsertionSort(int *a, unsigned int n)

{

    //“新元素”的当前位置CurrentPosition从N-1开始//只要新元素尚未到达a[0]，且前一个元素小于新元素，则不断地令新元素与前一个元素交换位置

    for (int CurPos = n - 1;CurPos !=  && a[CurPos - ] > a[CurPos];--CurPos)

        swap(&a[CurPos], &a[CurPos - ]);

}

　　上述想法就是插入排序的雏形：若元素X_n前面的X₀到X_n-1均已排好序，那么X_n只需要不断地向前“插入”，直至前一个元素与X_n的大小关系符合顺序，或X_n到达第一个位置即可完成排序。

　　不难发现，雏形中尚待解决的问题就是：如何令X_n前面的所有元素排好顺序？

　　这个问题可以尝试用递归的想法解决：要令X_n排好序，就需要令X₀到X_n_-1有序，而要令X_n-1排好序，则需要令X₀到X_n-2有序……最后会发现，要想令X₁排好序，则需要令X₀到X₀有序，而X₀到X₀一定是有序的，因为只有一个元素，也就是说此刻递归的基准情形出现了，而根据X₀到X₀的有序，可以得到X₀到X₁的有序，X₀到X₂的有序，直至得到X₀到X_n-1的有序，也就有了X₀到X_n的有序。因此这个递归的想法可行，而且这个想法就是插入排序从雏形到完整的解决思想。

　　将上述想法与插入排序的雏形相结合后，我们就得到了插入排序的实现方法：设数组a有n个元素，令下标x从1递增至n-1，对于每个a[x]我们都执行一次“插队”操作（即插入排序的雏形操作）。

　　下面为插入排序的例程：

void InsertionSort(int *a, unsigned int size)

{

    int temp;    //temp用于暂存执行插入的元素的值，使用temp可以避免元素间的交换

    int CurPos;   //CurPos表示执行插入的元素当下所处的下标

    //StartPos表示执行插入操作的元素开始插入时的下标

    //令StartPos从1递增至size-1，对于每个a[StartPos]，我们执行向前插入的操作

    for (int StartPos = ;StartPos < size;++StartPos)

    {

        temp = a[StartPos];

        for (CurPos = StartPos;CurPos !=  && a[CurPos - ] > temp;--CurPos)

            a[CurPos] = a[CurPos - ];   //令前一个元素后移，相当于令当前元素前移，但循环结束后记得令temp执行真实的移动

        a[CurPos] = temp;

    }

}

　　计算插入排序的时间复杂度并不难，最坏的情况是数组中元素恰好完全反序，此时插入排序的内循环必然执行至CurPos==0为止，而外循环从StartPos=1至StartPos=size-1共size-1次，每一次内循环执行StartPos次，即内循环总共执行1+2+3+……+size-1次，即size(size-1)/2次，即O(n²)

　　大部分人在学习C语言时就接触过冒泡排序，所以我们将不再对冒泡排序进行介绍。从时间复杂度上看，插入排序和冒泡排序是一样的，都是O(n²)，但是在实际执行时，插入排序会比冒泡排序好得多，原因就是在数据“部分有序”时，插入排序可以减少很多比较次数，而冒泡排序的比较则是“固定的”。

　　举例来说，现有数据1,2,3,4,5,7,6。若插入排序则需比较7次，交换1次（元素2,3,4,5,7均一次比较即结束，元素6与7比较一次，交换，再与5比较一次，结束）。而冒泡排序则需比较6+5+4+3+2+1=21次，交换1次。

　　造成冒泡排序与插入排序间差异的主要原因就是：插入排序的比较“更充分地利用了已存在的顺序信息”，而冒泡排序无论如何都需要(N-1)+(N-2)+(N-3)+……+1次比较。其实在数据“接近有序”的情况下，插入排序几乎是最快的排序，完全有序的数据其只需要N-1次比较即结束排序。可以说在O(n²)这个级别的排序算法中，插入排序是绝对的首选。

　　不过我们再次回顾上述例子，会发现两个排序算法虽然需要的比较次数不同，但需要的交换次数却是相同的，即使你换一个数据序列，这两个排序算法需要的交换次数依然是一样多，这是为什么呢？我们下一篇博文将揭开这个秘密。

　　附：选择排序也是常见的初学排序算法，它需要的比较次数为N+N-1+N-2+……+2，比冒泡排序还要多N-1次，但是它的交换次数有可能比插入和冒泡都要少，比如数据5,4,3,2,1需按从小到大排序，若使用插入或冒泡排序，将需要10次交换，而选择排序的交换操作只需要2次。但是实际使用时插入排序依然比选择排序优先考虑，因为：

　　选择排序的“实质交换”虽然可以更少，但形式上来说，选择排序是固定执行N次交换的：每一趟我们都会找出当前最小元素然后将其交换至正确位置，所以肯定有N次交换。只不过会出现“当前元素恰好在正确位置上”的情况，从而没有“实质交换”罢了，但代价依然是有的，比如判断当前元素位置与目标位置是否不同，或直接执行自己与自己的交换。此外，在选出当前最小元素时，我们都认为是“比较操作”，然而实际上这里面混杂着很多赋值操作。而这些不起眼的操作都会使得选择排序没有理想的那么快。

深入浅出数据结构C语言版（16）——插入排序的更多相关文章

数据结构C语言版表插入排序静态表
数据结构C语言版表插入排序.txt两个人吵架,先说对不起的人,并不是认输了,并不是原谅了.他只是比对方更珍惜这份感情./* 数据结构C语言版表插入排序算法10.3 P267-P270 编译 ...
深入浅出数据结构C语言版（5）——链表的操作
上一次我们从什么是表一直讲到了链表该怎么实现的想法上:http://www.cnblogs.com/mm93/p/6574912.html 而这一次我们就要实现所说的承诺,即实现链表应有的操作(至于游 ...
深入浅出数据结构C语言版（1）——什么是数据结构及算法
在很多数据结构相关的书籍,尤其是中文书籍中,常常把数据结构与算法"混合"起来讲,导致很多人初学时对于"数据结构"这个词的意思把握不准,从而降低了学习兴趣和学习信 ...
深入浅出数据结构C语言版（8）——后缀表达式、栈与四则运算计算器
在深入浅出数据结构(7)的末尾,我们提到了栈可以用于实现计算器,并且我们给出了存储表达式的数据结构(结构体及该结构体组成的数组),如下: //SIZE用于多个场合,如栈的大小.表达式数组的大小 #de ...
深入浅出数据结构C语言版（17）——希尔排序
在上一篇博文中我们提到:要令排序算法的时间复杂度低于O(n2),必须令算法执行"远距离的元素交换",使得平均每次交换减少不止1逆序数. 而希尔排序就是"简单地" ...
深入浅出数据结构C语言版（19）——堆排序
在介绍优先队列的博文中,我们提到了数据结构二叉堆,并且说明了二叉堆的一个特殊用途--排序,同时给出了其时间复杂度O(N*logN).这个时间界是目前我们看到最好的(使用Sedgewick序列的希尔排序 ...
深入浅出数据结构C语言版（20）——快速排序
正如上一篇博文所说,今天我们来讨论一下所谓的"高级排序"--快速排序.首先声明,快速排序是一个典型而又"简单"的分治的递归算法. 递归的威力我们在介绍插入排序时 ...
深入浅出数据结构C语言版（4）——表与链表
在我们谈论本文具体内容之前,我们首先要说明一些事情.在现实生活中我们所说的"表"往往是二维的,比如课程表,就有行和列,成绩表也是有行和列.但是在数据结构,或者说我们本文讨论的范围内 ...
深入浅出数据结构C语言版（3）——递归简论
相信学习过C语言的读者都已经接触过递归(不论是谭浩强的C程序设计还是C Primer Plus都有递归程序),本文就是对递归的基本原则进行简要介绍.首先,我们写一个基本的递归函数作为例子: int ...

随机推荐

HDOJ-2009 求数列的和
Problem Description 数列的定义如下:数列的第一项为n,以后各项为前一项的平方根,求数列的前m项的和. Input 输入数据有多组,每组占一行,由两个整数n(n<10000 ...
白话ASP.NET MVC之一：Url 路由
好久没有写关于ASP.NET MVC的东西了,虽然<ASP.NET MVC4框架揭秘>已经完完整整的看完一遍,但是感觉和一锅粥差不多,没什么可写的,因为我自己不理解,也就写不出来.现在开始 ...
nopCommerce 3.9 大波浪系列之开发支持多店的插件
一.基础介绍 nop支持多店及多语言,本篇结合NivoSlider插件介绍下如何开发支持多商城的小部件. 主要接口如下: ISettingService 接口:设置接口,可实现多店配置. (点击接口介 ...
[COGS 1752] 摩基亚Mokia
照例先上题面 1752. [BOI2007]摩基亚Mokia 输入文件:mokia.in 输出文件:mokia.out 时间限制:1.5 s 内存限制:128 MB [题目描述] 摩尔瓦多的移 ...
连续子序列最大和的O(NlogN)算法
对于一个数组,例如:int[] a = {4,-3,5,-2,-1,2,6,-2}找出一个连续子序列,对于任意的i和j,使得a[i]+a[i+1]+a[i+2]+.......+a[j]他的和是所有子 ...
Linux(5)压缩和归档管理
压缩和归档管理 tar :归档管理此命令可以把一系列文件归档到一个大文件中, 使用格式: -v :显示进度 -f :指定文件名称, f后面一定是.tar文件, 此参数必须放在选项最后 -t :列出文 ...
Linux(3)用户和权限管理
用户, 权限管理 Linux中root账号通常用于系统的维护和管理, 它对操作系统的所有部分具有不受限制的访问权限在Unix/Linux安装过程中, 系统会自动创建许多用户账号, 而这些默认的用户就 ...
SSRF漏洞学习
SSRF SSRF(Server-Side Request Forgery:服务器端请求伪造) 是一种由攻击者构造形成由服务端发起请求的一个安全漏洞.一般情况下,SSRF攻击的目标是从外网无法访问的内 ...
LoadRunner入门（一）
以LR自带的web系统为例(前提条件:已安装好lordrunner 11 ): 一.WebTours系统是lordrunner自带一个飞机订票系统网站,支持IE浏览器 1. WebTours服务启动 ...
idea如何添加外部jar包
假设我们要将G:\ModuleAPI_Java_2.2.0.0 .jar导入工程中: 首先,在mvn命令行执行下面命令: mvn install:install-file -Dfile=G:\Modu ...

深入浅出数据结构C语言版（16）——插入排序

深入浅出数据结构C语言版（16）——插入排序的更多相关文章

随机推荐

热门专题