小小c#算法题 - 9 - 基数排序 (Radix Sort)

基数排序和前几篇博客中写到的排序方法完全不同。前面几种排序方法主要是通过关键字间的比较和移动记录这两种操作来实现排序的，而实现基数排序不需要进行记录项间的比较。而是把关键字按一定规则分布在不同的区域，然后再重新整合，使之有序，属于分布排序的一种。

基数排序是一种借助多关键字排序的思想对单逻辑关键字进行排序的方法。基数排序是借助“分配”和“收集”两种操作对单逻辑关键字进行排序的一种内部排序方法。

下面举一个书上的例子，扑克牌的排序。对于扑克牌，在比较任意两张牌的大小时（暂不考虑大王和小王），首先要比较花色，因为花色的“地位”高于面值，比如黑桃>红心>方片>梅花；然后是面值的大小A>13>12>...>2，所以这里扑克牌的排序就牵涉到两种关键字。那么怎么来排序呢？这里有两种：

1. 遍历52张牌，根据花色分成4堆（分配操作）。然后对每一堆按面值大小整理有序，即每一花色堆中的牌再分成13堆（分配操作），这已经比较到了最后一个关键字，不能再往下分了，这时每堆只有一张。到最后一共有52堆（可以称之为52个子序列），最后将这些子序列依次联接在一起（收集操作）成为一个有序序列。

2.遍历52张牌，根据面值分成13堆（分配操作）。然后把这13堆摞起来（收集操作），按这样的顺序：面值最小（即面值为2）的堆放最下面，然后依次往上放，面值最大（即面值为A）的堆放最上面。这样13堆就又变成了一堆，再次遍历这一堆52张牌，根据花色不同分成4堆（分配操作）。这时候每个花色堆中的牌都是按面值有序的，比如黑桃堆，黑桃A在最下面，黑桃2在最上面。这时再把这四个花色堆按花色顺序堆在一起（收集操作），那么所有52张牌就都是有序的了。如果把黑桃堆放最下面，依次往上，梅花堆放最上面，那么牌的顺序就是递增的，反之则是递减的。

由此可见，基数排序根据多关键字，借助“分配”和“收集”的操作，并未有记录间的比较，就能使待排序列有序。

上面两种不同的方法其实引出了两种不同的基数排序：
最高位优先（Most Significant Digit first）法，简称MSD法。
最低位优先（Least Significant Digit first）法，简称LSD法。

以下是摘自数据结构严蔚敏版中的定义：

一般情况下，假设有n个记录的序列

{R₁,R₂,...,R_n}

且每个记录R_i中含有d个关键字(K_i², K_i¹, ..., K_i^d-1 )，则称R序列对关键字(K_i², K_i¹, ..., K_i^d-1 )有序是指：对于序列中任意两个记录R_i 和 R_j (1<=i<=j<=n)都满足下列有序关系：

(K_i², K_i¹, ..., K_i^d-1 ) < (K_j², K_j¹, ..., K_j^d-1 )

其中K⁰称为最主位关键字，K^d-1称为最次位关键字。

为实现多关键字排序，通常有两种方法：

第一种方法是：先对最主位关键字K⁰进行排序，将序列分成若干子序列，每个子序列中的记录都有相同的K⁰值，然后分别就每个子序列对关键字K¹进行排序，按K¹值不同再分成若干更小的子序列，依次重复，直到对K^d-2进行排序之后得到的每一子序列中的记录都有相同的关键字（K⁰, K¹, ... , K^d-2），而后分别每个子序列对K^d-1进行排序，最后将所有子序列依次联接在一起成为一个有序序列，这种方法称之为最高位优先法，简称MSD法。

第二种方法是从最次位关键字K^d-1起进行排序。然后再对高一位的关键字K^d-2进行排序，依次重复，直至对K⁰进行排序后便成为一个有序序列。这种方法称之为最低优先法，简称LSD法。

从上所述，可以看出两种排序方法的不同特点：

若按MSD进行排序，必须将序列逐层分割成若干子序列，然后对各子序列分别进行排序，到最后一个关键字时，一次收集所有子序列。这样貌似要更多的辅助存储空间。

若按LSD进行排序，每按关键字分成子序列后（一次分配），就进行一次收集操作。然后再遍历所有记录，按更主关键字再分配，然后再收集，... ，，所有针对每个关键字都是针对整个序列参加排序。用分配和收集操作可以实现排序，当然用前几篇博客中提到普通排序方法也可以，但这些排序方法必须是稳定的，这是显而易见的，比如，二位数集全中36和35的比较，这里其实有2个关键字，个位，十位。按LSD来，先比较个位，这时36在前，35在后，然后比较十位，由于都是3，如果是不稳定排序的话，那么他们两个的位置就有可能互换。从而导致非完全有序的序列。

好了，上面讲了好多理论知识，下面是一个链式基数排序的算法：

这里我们就拿整数的比较来讲，比较简单。每一位（个，十，百...）都是一个关键字，每个关键字的范围都是0~9。但其实，许多情况下针对不同的关键字可能有不同的取值范围，可能就要做一些相应的调整。

按所有记录存储在一个链表结构中，每个记录是链表的一个结点中的value。然后根据关键字的取值范围建立（0~9，共10个）10个子链表。遍历链表中的元素，比较个位，按个位的值，把结点添加相应的子链表的尾部。比如365的个位5，那么就放在第5个子链表的尾部。这样就完成了一次分配。

然后将子链表从第0个到第9个首尾相连起来：header0...tail0->header1...tail1->... ... ->header9...tail9。这样就完成了一次收集。

然后再根据十位来比较，根据十位的值装入不同子链表中（此时的子链表是新的，可以是新建的，可以是处理清空过的，代码处理一下即可）。这样又完成了一次分配。

然后再首尾相连，完成一次收集。

。。。这要一直下去，比较完所有关键字，位数。即完成序列的排序。

下面是代码：

先要建立自定义的链表结点和链表的数据结构，我这里简单写了一下：

    // 单链表

    class SingleLinkedList<T>

    {

        public MyLLNode<T> First

        {

            get;

            set;

        }

        public MyLLNode<T> Last

        {

            get;

            set;

        }

        public void AddLast(MyLLNode<T> node)

        {

            if (First == null)

            {

                First = node;

                Last = node;

                node.Next = null;

            }

            else

            {

                Last.Next = node;

                Last = node;

                node.Next = null;

            }

        }

    }

    // 单链表结点

    class MyLLNode<T>

    {

        public T Value

        {

            get;

            set;

        }

        public MyLLNode<T> Next

        {

            get;

            set;

        }

    }

下面是排序的代码：

        private static void RandixSort(int[] myArray,int keyNum)

        {

            SingleLinkedList<int> listArray = new SingleLinkedList<int>();

            foreach (int i in myArray)

            {

                listArray.AddLast(new MyLLNode<int>() { Value = i });

            }

            for (int i = ; i < keyNum; i++)

            {

                // 对每个关键字执行分配和收集操作

                DistributeAndCollect(listArray, i);

            }

            int j = ;

            while (listArray.First != null)

            {

                myArray[j++] = listArray.First.Value;

                listArray.First = listArray.First.Next;

            }

        }

        // 分配和收集

        private static void DistributeAndCollect(SingleLinkedList<int> listArray, int i)

        {

            int randix = ; //关键字取值范围

            int divider = (int)Math.Pow(, i);

            List<SingleLinkedList<int>> subLists = new List<SingleLinkedList<int>>(); //建立子序列

            for (int j = ; j < randix; j++)

            {

                subLists.Add(new SingleLinkedList<int>());

            }

            // 开始一次分配

            while (listArray.First != null)

            {

                int index = (listArray.First.Value / divider) % ;

                MyLLNode<int> tempNode=listArray.First.Next;

                subLists[index].AddLast(listArray.First);

                listArray.First = tempNode;

            }

            // 开始一次收集

            int k = ;

            for (; k < randix; k++)

            {

                if (subLists[k].First != null)

                {

                    // 找到第一个非空子序列以设置总序列的First值

                    listArray.First = subLists[k].First;

                    listArray.Last = subLists[k].Last;

                    break;

                }

            }

            // 找好子序列设置好listArray.First后，开始处理非空子序列的首尾相连

            for (; k < randix; k++)

            {

                if (subLists[k].First != null)

                {

                    listArray.Last.Next = subLists[k].First;

                    listArray.Last = subLists[k].Last;

                }

            }

        }

再次强调一点，只是这个示例中的每个关键字的处理情况一样，所以DistributeAndCollect方法中的处理比较简单，有时候需要针对不同的关键字作相应的调整，比如randix取值范围不一样的情况。

下面的调用：

　　　　 static void Main(string[] args)

        {

            int[] numbers = { , , , , , , , , , , , ,  };

            RandixSort(numbers, );

            foreach (int i in numbers)

            {

                Console.Write(i.ToString() + " ");

            }

            Console.Read();

        }

最后，针对这个例子能看出，对于n个记录（假设每个记录含d个关键字，每个关键字的取值范围是randix个值）进行链式基数排序的时间复杂度为O(d(n+randix))，其中每一趟分配的时间复杂度为O(n),第一趟收集的时间复杂度为O(randix)[因为有randix个子链表]，整个排序需进行d趟分配和收集。所需辅助空间为2*randix个引用，其实每个子序列也就保存了首尾两个引用，结点还是那么些个结点，只不过通过设置next指针把其分开了而已。

好了，这就是基数排序的全部内容。

小小c#算法题 - 9 - 基数排序 (Radix Sort)的更多相关文章

小小c#算法题 - 8 - 归并排序 (Merging Sort)
“归并”的含义是将两个或两个以上的有序序列组合成一个新的有序序列.这个“归并”可以在O(n+m)的数量级上实现,但这同时也需要O(n+m)的空间复杂度.具体为:首先分配一个新的长度为n+m的空序列,然 ...
小小c#算法题 - 7 - 堆排序 (Heap Sort)
在讨论堆排序之前,我们先来讨论一下另外一种排序算法——插入排序.插入排序的逻辑相当简单,先遍历一遍数组找到最小值,然后将这个最小值跟第一个元素交换.然后遍历第一个元素之后的n-1个元素,得到这n-1个 ...
经典排序算法 - 基数排序Radix sort
经典排序算法 - 基数排序Radix sort 原理类似桶排序,这里总是须要10个桶,多次使用首先以个位数的值进行装桶,即个位数为1则放入1号桶,为9则放入9号桶,临时忽视十位数比如待排序数组[ ...
小小c#算法题 - 11 - 二叉树的构造及先序遍历、中序遍历、后序遍历
在上一篇文章小小c#算法题 - 10 - 求树的深度中,用到了树的数据结构,树型结构是一类重要的非线性数据结构,树是以分支关系定义的层次结构,是n(n>=0)个结点的有限集.但在那篇文章中,只 ...
基数排序(radix sort)
#include<iostream> #include<ctime> #include <stdio.h> #include<cstring> #inc ...
学习算法-基数排序(radix sort)卡片分类(card sort) C++数组实现
基数排序称为卡片分类,这是一个比较早的时间越多,排名方法. 现代计算机出现之前,它已被用于排序老式打孔卡. 说下基数排序的思想.前面我有写一个桶式排序,基数排序的思想是桶式排序的推广. 桶式排序:ht ...
[转] 经典排序算法 - 基数排序Radix sort
原理类似桶排序,这里总是需要10个桶,多次使用首先以个位数的值进行装桶,即个位数为1则放入1号桶,为9则放入9号桶,暂时忽视十位数例如待排序数组[62,14,59,88,16]简单点五个数字分 ...
桶排序/基数排序(Radix Sort)
说基数排序之前,我们先说桶排序: 基本思想:是将阵列分到有限数量的桶子里.每个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序).桶排序是鸽巢排序的一种归纳结果.当要被排序 ...
小小c#算法题 - 6 - 快速排序 (QuickSort)
快速排序是排序算法中效率比较高的一种,也是面试常被问到的问题. 快速排序(Quick Sort)是对冒泡排序的一种改进.它的基本思想是,通过一趟排序将待排记录分割成独立的两部分,其中一部分记录的关键字 ...

随机推荐

SQL Server 索引中include
SQL Server 索引中include的魅力(具有包含性列的索引) http://www.cnblogs.com/gaizai/archive/2010/01/11/1644358.html 开文 ...
Centos 7 安装 Python3.7
目录下载Python Python安装遇到问题错误: configure: error: no acceptable C compiler found in $PATH 错误: can't de ...
51nod1680 区间求和
有n个数,给定一个k,求所有长度大于等于k的区间中前k大数的总和.这样就比较简单相信大家都会,所以此题要求当k=1~n的总和,即求 ∑nk=1∑n−k+1i=1∑nj=i+k−1 区间前K大和 In ...
MA82G5D16AS16 主频调试记录
MA82G5D16AS16 主频调试记录当 SCKS 设置为 MCKDO / 128 时 MCU 的电流为 0.58mA,100UF 电容可以维持 0.5S,大概可以满足. 但是需要注意外围的线路 ...
mysql5.6之传输表空间迁移表或恢复误删除的表
一,简单说明: 1),传输表空间的限制: 1,mysql 版本 5.6.6 及其以上,并且版本建议源和目标版本建议都是GA版并且大版本一样 2,表引擎为innodb并且开启独立表空间 innod ...
Verilog数组表示及初始化
(转)Verilog数组表示及初始化这里的内存模型指的是内存的行为模型.Verilog中提供了两维数组来帮助我们建立内存的行为模型.具体来说,就是可以将内存宣称为一个reg类型的数组,这个数组中的任 ...
maven打包指定main函数的入口，生成依赖的包
为了使Jar包中指定Main方法位置和生成依赖包,需要在pom文件中加入如下配置: <build> <plugins> <plugin> <groupId&g ...
VisualGDB系列8：使用VS创建CMake Linux项目
根据VisualGDB官网(https://visualgdb.com)的帮助文档大致翻译而成.主要是作为个人学习记录.有错误的地方,Robin欢迎大家指正. 本文介绍如何使用VS来创建.构建.调试一 ...
WebDriver测试web中遇到的弹出框或不确定的页面
我自己是用try catch解决的,不知道其他人的解决方法?如有,可以留言
nc之一：NetCat简介与使用方法
精品学习网考试频道小编应广大考生的需要,特为参加考试的考生策划了“NetCat简介与使用方法”专题等有关资料,供考生参考! 在入侵中它是最经典的工具之一 ,NetCat被所有的网络安全爱好者和研究者称 ...

小小c#算法题 - 9 - 基数排序 (Radix Sort)

小小c#算法题 - 9 - 基数排序 (Radix Sort)的更多相关文章

随机推荐

热门专题