归并排序

归并排序遵循分治的思想：将原问题分解为几个规模较小但类似于原问题的子问题，递归地求解这些子问题，然后合并这些子问题的解来建立原问题的解，归并排序的步骤如下：

划分：分解待排序的 n 个元素的序列成各具 n/2 个元素的两个子序列，将长数组的排序问题转换为短数组的排序问题，当待排序的序列长度为 1 时，递归划分结束
合并：合并两个已排序的子序列得出已排序的最终结果

归并排序的代码实现如下：

    private void sort(int[] nums, int left, int right) {

        if (left >= right) {

            return;

        }

        // 划分

        int mid = left + right >> 1;

        sort(nums, left, mid);

        sort(nums, mid + 1, right);

        // 合并

        merge(nums, left, mid, right);

    }

    private void merge(int[] nums, int left, int mid, int right) {

        // 辅助数组

        int[] temp = Arrays.copyOfRange(nums, left, right + 1);

        int leftBegin = 0, leftEnd = mid - left;

        int rightBegin = leftEnd + 1, rightEnd = right - left;

        for (int i = left; i <= right; i++) {

            if (leftBegin > leftEnd) {

                nums[i] = temp[rightBegin++];

            } else if (rightBegin > rightEnd || temp[leftBegin] < temp[rightBegin]) {

                nums[i] = temp[leftBegin++];

            } else {

                nums[i] = temp[rightBegin++];

            }

        }

    }

归并排序最吸引人的性质是它能保证将长度为 n 的数组排序所需的时间和 nlogn 成正比；它的主要缺点是所需的额外空间和 n 成正比。

算法特性：

空间复杂度：借助辅助数组实现合并，使用 O(n) 的额外空间；递归深度为 logn，使用 O(logn) 大小的栈帧空间。忽略低阶部分，所以空间复杂度为 O(n)
非原地排序
稳定排序
非自适应排序

以上代码是归并排序常见的实现，下面我们来一起看看归并排序的优化策略：

将多次创建小数组的开销转换为只创建一次大数组

在上文实现中，我们在每次合并两个有序数组时，即使是很小的数组，我们都会创建一个新的 temp[] 数组，这部分耗时是归并排序运行时间的主要部分。更好的解决方案是将 temp[] 数组定义成 sort() 方法的局部变量，并将它作为参数传递给 merge() 方法，实现如下：

    private void sort(int[] nums, int left, int right, int[] temp) {

        if (left >= right) {

            return;

        }

        // 划分

        int mid = left + right >> 1;

        sort(nums, left, mid, temp);

        sort(nums, mid + 1, right, temp);

        // 合并

        merge(nums, left, mid, right, temp);

    }

    private void merge(int[] nums, int left, int mid, int right, int[] temp) {

        System.arraycopy(nums, left, temp, left, right - left + 1);

        int l = left, r = mid + 1;

        for (int i = left; i <= right; i++) {

            if (l > mid) {

                nums[i] = temp[r++];

            } else if (r > right || temp[l] < temp[r]) {

                nums[i] = temp[l++];

            } else {

                nums[i] = temp[r++];

            }

        }

    }

当数组有序时，跳过 merge() 方法

我们可以在执行合并前添加判断条件：如果nums[mid] <= nums[mid + 1]时我们认为数组已经是有序的了，那么我们就跳过 merge() 方法。它不影响排序的递归调用，但是对任意有序的子数组算法的运行时间就变成线性的了，代码实现如下：

    private void sort(int[] nums, int left, int right, int[] temp) {

        if (left >= right) {

            return;

        }

        // 划分

        int mid = left + right >> 1;

        sort(nums, left, mid, temp);

        sort(nums, mid + 1, right, temp);

        // 合并

        if (nums[mid] > nums[mid + 1]) {

            merge(nums, left, mid, right, temp);

        }

    }

    private void merge(int[] nums, int left, int mid, int right, int[] temp) {

        System.arraycopy(nums, left, temp, left, right - left + 1);

        int l = left, r = mid + 1;

        for (int i = left; i <= right; i++) {

            if (l > mid) {

                nums[i] = temp[r++];

            } else if (r > right || temp[l] < temp[r]) {

                nums[i] = temp[l++];

            } else {

                nums[i] = temp[r++];

            }

        }

    }

对小规模子数组使用插入排序

对小规模数组进行排序会使递归调用过于频繁，而使用插入排序处理小规模子数组一般可以将归并排序的运行时间缩短 10% ~ 15%，代码实现如下：

    /**

     * M 取值在 5 ~ 15 之间大多数情况下都能令人满意

     */

    private final int M = 9;

    private void sort(int[] nums, int left, int right) {

        if (left + M >= right) {

            // 插入排序

            insertSort(nums);

            return;

        }

        // 划分

        int mid = left + right >> 1;

        sort(nums, left, mid);

        sort(nums, mid + 1, right);

        // 合并

        merge(nums, left, mid, right);

    }

    /**

     * 插入排序

     */

    private void insertSort(int[] nums) {

        for (int i = 1; i < nums.length; i++) {

            int base = nums[i];

            int j = i - 1;

            while (j >= 0 && nums[j] > base) {

                nums[j + 1] = nums[j--];

            }

            nums[j + 1] = base;

        }

    }

    private void merge(int[] nums, int left, int mid, int right) {

        // 辅助数组

        int[] temp = Arrays.copyOfRange(nums, left, right + 1);

        int leftBegin = 0, leftEnd = mid - left;

        int rightBegin = leftEnd + 1, rightEnd = right - left;

        for (int i = left; i <= right; i++) {

            if (leftBegin > leftEnd) {

                nums[i] = temp[rightBegin++];

            } else if (rightBegin > rightEnd || temp[leftBegin] < temp[rightBegin]) {

                nums[i] = temp[leftBegin++];

            } else {

                nums[i] = temp[rightBegin++];

            }

        }

    }

快速排序

快速排序也遵循分治的思想，它与归并排序不同的是，快速排序是原地排序，而且快速排序会先排序当前数组，再对子数组进行排序，它的算法步骤如下：

哨兵划分：选取数组中最左端元素为基准数，将小于基准数的元素放在基准数左边，将大于基准数的元素放在基准数右边
排序子数组：将哨兵划分的索引作为划分左右子数组的分界，分别对左右子数组进行哨兵划分和排序

快速排序的代码实现如下：

    private void sort(int[] nums, int left, int right) {

        if (left >= right) {

            return;

        }

        // 哨兵划分

        int partition = partition(nums, left, right);

        // 分别排序两个子数组

        sort(nums, left, partition - 1);

        sort(nums, partition + 1, right);

    }

    /**

     * 哨兵划分

     */

    private int partition(int[] nums, int left, int right) {

        // 以 nums[left] 作为基准数，并记录基准数索引

        int originIndex = left;

        int base = nums[left];

        while (left < right) {

            // 从右向左找小于基准数的元素

            while (left < right && nums[right] >= base) {

                right--;

            }

            // 从左向右找大于基准数的元素

            while (left < right && nums[left] <= base) {

                left++;

            }

            swap(nums, left, right);

        }

        // 将基准数交换到两子数组的分界线

        swap(nums, originIndex, left);

        return left;

    }

    private void swap(int[] nums, int left, int right) {

        int temp = nums[left];

        nums[left] = nums[right];

        nums[right] = temp;

    }

算法特性：

时间复杂度：平均时间复杂度为 O(nlogn)，最差时间复杂度为 O(n2)
空间复杂度：最差情况下，递归深度为 n，所以空间复杂度为 O(n)
原地排序
非稳定排序
自适应排序

归并排序的时间复杂度一直是 O(nlogn)，而快速排序在最坏的情况下时间复杂度为 O(n2)，为什么归并排序没有快速排序应用广泛呢？

答：因为归并排序是非原地排序，在合并阶段需要借助非常量级的额外空间

快速排序有很多优点，但是在哨兵划分不平衡的情况下，算法的效率会比较低效。下面是对快速排序排序优化的一些方法：

切换到插入排序

对于小数组，快速排序比插入排序慢，快速排序的 sort() 方法在长度为 1 的子数组中也会调用一次，所以，在排序小数组时切换到插入排序排序的效率会更高，如下：

    /**

     * M 取值在 5 ~ 15 之间大多数情况下都能令人满意

     */

    private final int M = 9;

    public void sort(int[] nums, int left, int right) {

        // 小数组采用插入排序

        if (left + M >= right) {

            insertSort(nums);

            return;

        }

        int partition = partition(nums, left, right);

        sort(nums, left, partition - 1);

        sort(nums, partition + 1, right);

    }

    /**

     * 插入排序

     */

    private void insertSort(int[] nums) {

        for (int i = 1; i < nums.length; i++) {

            int base = nums[i];

            int j = i - 1;

            while (j >= 0 && nums[j] > base) {

                nums[j + 1] = nums[j--];

            }

            nums[j + 1] = base;

        }

    }

    private int partition(int[] nums, int left, int right) {

        int originIndex = left;

        int base = nums[left];

        while (left < right) {

            while (left < right && nums[right] >= base) {

                right--;

            }

            while (left < right && nums[left] <= base) {

                left++;

            }

            swap(nums, left, right);

        }

        swap(nums, left, originIndex);

        return left;

    }

    private void swap(int[] nums, int left, int right) {

        int temp = nums[left];

        nums[left] = nums[right];

        nums[right] = temp;

    }

基准数优化

如果数组为倒序的情况下，选择最左端元素为基准数，那么每次哨兵划分会导致右数组长度为 0，进而使快速排序的时间复杂度为 O(n2)，为了尽可能避免这种情况，我们可以对基准数的选择进行优化，采用三取样切分的方法：选取数组最左端、中间和最右端这三个值的中位数为基准数，这样选择的基准数大概率不是区间的极值，时间复杂度为 O(n2) 的概率大大降低，代码实现如下：

    public void sort(int[] nums, int left, int right) {

        if (left >= right) {

            return;

        }

        // 基准数优化

        betterBase(nums, left, right);

        int partition = partition(nums, left, right);

        sort(nums, left, partition - 1);

        sort(nums, partition + 1, right);

    }

    /**

     * 基准数优化，将 left, mid, right 这几个值中的中位数换到 left 的位置

     * 注意其中使用了异或运算进行条件判断

     */

    private void betterBase(int[] nums, int left, int right) {

        int mid = left + right >> 1;

        if ((nums[mid] < nums[right]) ^ (nums[mid] < nums[left])) {

            swap(nums, left, mid);

        } else if ((nums[right] < nums[left]) ^ (nums[right] < nums[mid])) {

            swap(nums, left, right);

        }

    }

    private int partition(int[] nums, int left, int right) {

        int originIndex = left;

        int base = nums[left];

        while (left < right) {

            while (left < right && nums[right] >= base) {

                right--;

            }

            while (left < right && nums[left] <= base) {

                left++;

            }

            swap(nums, left, right);

        }

        swap(nums, originIndex, left);

        return left;

    }

    private void swap(int[] nums, int left, int right) {

        int temp = nums[left];

        nums[left] = nums[right];

        nums[right] = temp;

    }

三向切分

在数组有大量重复元素的情况下，快速排序的递归性会使元素全部重复的子数组经常出现，而对这些数组进行快速排序是没有必要的，我们可以对它进行优化。

一个简单的想法是将数组切分为三部分，分别对应小于、等于和大于基准数的数组，每次将其中“小于”和“大于”的数组进行排序，那么最终也能得到排序的结果，这种策略下我们不会对等于基准数的子数组进行排序，提高了排序算法的效率，它的算法流程如下：

从左到右遍历数组，维护指针 l 使得 [left, l - 1] 中的元素都小于基准数，维护指针 r 使得 [r + 1, right] 中的元素都大于基准数，维护指针 mid 使得 [l, mid - 1] 中的元素都等于基准数，其中 [mid, r] 区间中的元素还未确定大小关系，图示如下：

它的代码实现如下：

    public void sort(int[] nums, int left, int right) {

        if (left >= right) {

            return;

        }

        // 三向切分

        int l = left, mid = left + 1, r = right;

        int base = nums[l];

        while (mid <= r) {

            if (nums[mid] < base) {

                swap(nums, l++, mid++);

            } else if (nums[mid] > base) {

                swap(nums, mid, r--);

            } else {

                mid++;

            }

        }

        sort(nums, left, l - 1);

        sort(nums, r + 1, right);

    }

    private void swap(int[] nums, int left, int right) {

        int temp = nums[left];

        nums[left] = nums[right];

        nums[right] = temp;

    }

这也是经典的荷兰国旗问题，因为这就好像用三种可能的主键值将数组排序一样，这三种主键值对应着荷兰国旗上的三种颜色

巨人的肩膀

《Hello 算法》：11.5 和 11.6 小节
《算法第四版》：2.3 节快速排序
《算法导论第三版》：第 2.2、2.3、7 章

作者：京东物流王奕龙

来源：京东云开发者社区自猿其说 Tech 转载请注明来源

时间复杂度为 O(nlogn) 的排序算法的更多相关文章

时间复杂度为O(nlogn)的排序算法
时间复杂度为O(nlogn)的排序算法(归并排序.快速排序),比时间复杂度O(n²)的排序算法更适合大规模数据排序. 归并排序归并排序的核心思想采用"分治思想",将要排序的数组 ...
平均时间复杂度为O(nlogn)的排序算法
本文包括 1.快速排序 2.归并排序 3.堆排序 1.快速排序快速排序的基本思想是:采取分而治之的思想,把大的拆分为小的,每一趟排序,把比选定值小的数字放在它的左边,比它大的值放在右边:重复以上步骤 ...
备战秋招之十大排序——O(nlogn)级排序算法
时间复杂度O(nlogn)级排序算法五.希尔排序首批将时间复杂度降到 O(n^2) 以下的算法之一.虽然原始的希尔排序最坏时间复杂度仍然是O(n^2),但经过优化的希尔排序可以达到 O(n^{1. ...
时间复杂度为O(nlogn)的LIS算法
时间复杂度为 n*logn的LIS算法是用一个stack维护一个最长递增子序列如果存在 x < y 且 a[x] > a[y],那么我们可以用a[y]去替换a[x] 因为a[y]比较小 ...
JavaScript 数据结构与算法之美 - 十大经典排序算法汇总（图文并茂）
1. 前言算法为王. 想学好前端,先练好内功,内功不行,就算招式练的再花哨,终究成不了高手:只有内功深厚者,前端之路才会走得更远. 笔者写的 JavaScript 数据结构与算法之美系列用的语言是 ...
11.经典O(n²)比较型排序算法
关注公号「码哥字节」修炼技术内功心法,完整代码可跳转 GitHub:https://github.com/UniqueDong/algorithms.git 摘要:排序算法提多了,很多甚至连名字你都没 ...
Python版常见的排序算法
学习笔记排序算法目录学习笔记排序算法 1.冒泡排序 2.选择排序 3.插入排序 4.希尔排序 5.快速排序 6.归并排序 7.堆排序排序分为两类,比较类排序和非比较类排序,比较类排序通过比较 ...
C#中常用的排序算法的时间复杂度和空间复杂度
常用的排序算法的时间复杂度和空间复杂度常用的排序算法的时间复杂度和空间复杂度排序法最差时间分析平均时间复杂度稳定度空间复杂度冒泡排序 O(n2) O(n2) 稳定 O(1) 快速排序 ...
排序—时间复杂度为O(n2)的三种排序算法
1 如何评价.分析一个排序算法? 很多语言.数据库都已经封装了关于排序算法的实现代码.所以我们学习排序算法目的更多的不是为了去实现这些代码,而是灵活的应用这些算法和解决更为复杂的问题,所以更重要的是学 ...
八大排序算法Java
目录(?)[-] 概述插入排序直接插入排序Straight Insertion Sort 插入排序希尔排序Shells Sort 选择排序简单选择排序Simple Selection Sort 选择 ...

随机推荐

修复grub分区
修复grub分区实验环境:grup.cfg文件丢失,引导出错 1,删除grup.cfg配置文件 2,重启虚拟机 3,重启进入救援模式再读进度条的时候快速点击Esc键选着光驱或者u盘启动
[golang]获取本机IP
前言方便在内网环境中获取服务器本机IP,省了在脚本中过滤ip或ifconfig的结果. 如果内网中有nginx的话,通过nginx获取本机IP也很方便,可参考借助nginx自动获取本机IP 示例代 ...
Lithosphere是什么，它解决什么问题？
这问题很好,一针见血,它解决什么问题? 那这得说说,在IoT应用中,我们会碰到什么问题? 和纯软件项目,互联网项目比,IoT应用项目一个比较大不同的地方,应该是它既要做软件,又要做硬件. 我并不是硬件 ...
表格JS实现在线Excel的附件上传与下载
摘要:本文由葡萄城技术团队于博客园原创并首发.转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 前言在本地使用Excel时,经常会有需要在Excel中添加一 ...
给你安利一款带有AI功能的数据库管理工具
写在前面说到数据库管理工具,大家应该不陌生了小伙伴们应该都用过Navicat.DBever.DataGrip.SQLyog.plsqldeveloper等数据库管理工具这些工具呢都各自有优缺点. ...
用OLED屏幕播放视频(1): 项目介绍
下面的系列文章记录了如何使用一块linux开发扳和一块OLED屏幕实现视频的播放: 项目介绍为OLED屏幕开发I2C驱动使用cuda编程加速视频处理这篇文章主要对项目的实现做整体的介绍, 包括硬 ...
MySQL 分表查询
分表是一种数据库分割技术,用于将大表拆分成多个小表,以提高数据库的性能和可管理性.在MySQL中,可以使用多种方法进行分表,例如基于范围.哈希或列表等.下面将详细介绍MySQL如何分表以及分表后如何进 ...
Github的一个奇技淫巧
背景前段时间给 VictoriaLogs 提交了一个 PR: https://github.com/VictoriaMetrics/VictoriaMetrics/pull/4934 本来一切都很顺 ...
浅入深出的微前端MicroApp
前言: 本文是由最近做的一个项目有感而发,因为之前做了一些技术栈的统一,为了用ant Design的pro-table,PC统一使用react,但是我们有一些老的项目是vue的,本次新页面较多,老页面 ...
WPF中以MVVM方式，实现RTSP视频播放
前言视频播放在上位机开发中经常会遇到,基本上是两种常见的解决方案 1.采用厂家提供的sdk和前端控件进行展示,常见的海康/大华都提供了相关sdk及文档 2.开启相机onvif协议,捅过rtsp视频流进 ...

时间复杂度为 O(nlogn) 的排序算法