一、寻找两个有序数组的中位数

1.1 问题描述

给定两个大小为 m 和 n 的不同时为空的有序数组 nums1 和 nums2。找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。

1.2 算法分析

题目要求的时间复杂度是 O(log(m + n)),要产生这样级别的时间复杂度只有采用二分查找法,用分治递归的思路来考虑这个问题。

需要转换题目中求中位数的问题为求第 k 小数的问题。如果 m + n 是奇数,那么寻找第 k = (m + n)/2 + 1 小的数即可;如果长度和是偶数,那么我们还需要寻找第 (m + n)/2 小的数,然后计算两数的平均值。

在求解整个问题的过程中,我们始终需要考虑一个很重要的问题--数组索引越界问题。

下面将详细地分析整个递归流程。

①、首先定义递归函数的作用:寻找两个有序数组 nums1 数组中 [L1, R1] 范围内和 nums2 数组 [L2, R2] 范围内第 k 小的数,k 从 1开始计数。

/**
* L1 nums1数组的寻找范围的左边界
* R1 nums1数组的寻找范围的右边界
* L2 nums2数组的寻找范围的左边界
* R2 nums2数组的寻找范围的右边界
* k 需要寻找第k小的元素
*/
int findKth(int[] nums1, int L1, int R1, int[] nums2, int L2, int R2, int k)

②、用 len1 = R1 - L1 + 1 来记录 nums1 数组中寻找范围的长度,用 len2 = R2 - L2 + 1 来记录 nums2 数组中寻找范围的长度。

③、如果要寻找的 k > len1 + len2,就像只有 3 个数字要找第 4 小的数一样,超出寻找区域,显然无法找到。

④、递归的终止条件:

  1. 当 len1 = 0 时,说明只有 nums2 数组中有元素,直接取 nums2[L2 + k - 1] 位元素即可。

  2. 当 k = 1 时,说明要取的是两个有序数组中的最小值 MIN(nums1[L1], nums2[L2])。

⑤、递归过程:

由于要求的是第 k 小的数,而且是在两个有序数组中求。划分两个数组时按照 k 值来分。取变量 i = MIN(len1, k/2),之所以这么取,是为了防止 L1 + k/2 - 1 > len1 导致从 nums1 取值越界。再取变量 j = MIN(len2, k/2)。

接下来比较 nums1[L1 + i - 1] 和 nums2[L2 + i - 1] 这两个值。

如果 nums1[L1 + i - 1] <= nums2[L2 + j - 1],显然 nums1 数组中索引为 L1 + i - 1 及之前的元素不可能是中位数,去除 nums1 数组中 [L1, L1 + i - 1] 范围内的元素,缩小了查找范围。我们递归调用该函数,此时在 nums1 中的查找范围变成了 nums1[L1 + i, R1],此时要找的也不应该是第 k 小的元素,因为已经剔除了 i 个比 k 小的元素,因此我们要找的元素变成了第 k - i 小的元素。

如果 nums1[L1 + i - 1] > nums2[L2 + j - 1],同理,nums2 数组中索引为 L2 + j - 1 及之前的元素不可能是中位数,缩小查找范围,剔除了 j 个比 k 小的元素,因此我们要找的元素变成了第 k - j 小的元素。

因为 i + j = MIN(len1, k/2) + MIN(len2, k/2) <= k,所以可以直接判断 [L1, L1 + i - 1] 或者 [L2, L2 + j -1] 区间的元素不可能是中位数。 

总结:算法的思想是不断的剔除数据,逐渐逼近第 k 小的数。

1.3 时间复杂度

假设数组长度足够长,每次剔除的元素都是 k/2(i 或者j),显然我们需要 log(k) 次才能找到第 k 小数,这和二分查找法是同理的,而我们要找的 k 值要么是 (m + n)/2 + 1,要么额外再加上 (m + n)/2,因此时间复杂度是 O(log(m + n)) 级别的。

1.4 代码实现

#define MIN(a, b) (a) < (b) ? (a) : (b)

int findKth(int* nums1, int left1, int right1, int* nums2, int left2, int right2, int k)
{
int n1 = right1 - left1 + 1;
int n2 = right2 - left2 + 1; // 递归退出条件
if(k > n1 + n2) {
return 0; // 实际上 k 不会小于 n1 + n2
} if(n1 == 0) {
return nums2[left2 + k - 1];
}
else if (n2 == 0) {
return nums1[left1 + k - 1];
}
if(k == 1) {
return MIN(nums1[left1], nums2[left2]);
}
int i = MIN(n1, k / 2);
int j = MIN(n2, k / 2); // 剔除比第 k 小的数还小的数,逐渐逼近
if(nums1[left1 + i - 1] > nums2[left2 + j - 1]) {
return findKth(nums1, left1, right1, nums2, left2 + j, right2, k - j);
}
else {
return findKth(nums1, left1 + i, right1, nums2, left2, right2, k - i);
}
} double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size)
{
// k = (nums1Size + nums2Size) /2 + 1,因为 k 从 1 开始计数
int mid1 = findKth(nums1, 0, nums1Size - 1, nums2, 0, nums2Size - 1, (nums1Size + nums2Size) / 2 + 1); // 两个数组总长度是奇数
if((nums1Size + nums2Size) % 2 != 0) {
return mid1;
}
// 两个数组总长度是偶数
else {
// 额外求 (nums1Size + nums2Size) / 2 的值
int mid2 = findKth(nums1, 0, nums1Size - 1, nums2, 0, nums2Size - 1, (nums1Size + nums2Size) / 2);
return (mid1 + mid2) / 2.0;
}
}

二、内容来源

LeetCode004——两个排序数组的中位数 

第 k 小的数的更多相关文章

  1. *HDU2852 树状数组(求第K小的数)

    KiKi's K-Number Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)T ...

  2. 计算序列中第k小的数

    作者:jostree 转载请注明出处 http://www.cnblogs.com/jostree/p/4046399.html 使用分治算法,首先选择随机选择轴值pivot,并使的序列中比pivot ...

  3. [LeetCode] Find K-th Smallest Pair Distance 找第K小的数对儿距离

    Given an integer array, return the k-th smallest distance among all the pairs. The distance of a pai ...

  4. #7 找出数组中第k小的数

    「HW面试题」 [题目] 给定一个整数数组,如何快速地求出该数组中第k小的数.假如数组为[4,0,1,0,2,3],那么第三小的元素是1 [题目分析] 这道题涉及整数列表排序问题,直接使用sort方法 ...

  5. 无序数组求第k大/第k小的数

    根据http://www.cnblogs.com/zhjp11/archive/2010/02/26/1674227.html 博客中所总结的7种解法,我挑了其中的解法3和解法6进行了实现. 解法3: ...

  6. 查找第K小的数 BFPRT算法

    出处 http://blog.csdn.net/adong76/article/details/10071297 BFPRT算法是解决从n个数中选择第k大或第k小的数这个经典问题的著名算法,但很多人并 ...

  7. 基于快速排序思想partition查找第K大的数或者第K小的数。

    快速排序 下面是之前实现过的快速排序的代码. function quickSort(a,left,right){ if(left==right)return; let key=partition(a, ...

  8. 算法---数组总结篇2——找丢失的数,找最大最小,前k大,第k小的数

    一.如何找出数组中丢失的数 题目描述:给定一个由n-1个整数组成的未排序的数组序列,其原始都是1到n中的不同的整数,请写出一个寻找数组序列中缺失整数的线性时间算法 方法1:累加求和 时间复杂度是O(N ...

  9. cogs930找第k小的数(k-th number)

    cogs930找第k小的数(k-th number) 原题链接 题解 好题... 终极版是bzoj3065(然而并不会) 先讲这个题... 维护\(n+1\)个值域线段树(用主席树),标号\(0\) ...

  10. 选择问题(选择数组中第K小的数)

    由排序问题可以引申出选择问题,选择问题就是选择并返回数组中第k小的数,如果把数组全部排好序,在返回第k小的数,也能正确返回,但是这无疑做了很多无用功,由上篇博客中提到的快速排序,稍稍修改下就可以以较小 ...

随机推荐

  1. JMeter-WebService接口的测试

    前言 JMeter3.2版本之后就没有SOAP/XML-RPC Request插件了,那么该如何进行webservice接口的测试呢? 今天我们来一起学习一下怎么在3.2以后版本的JMeter进行we ...

  2. C# 关于位运算的学习笔记

    一.理解什么是位运算 程序中的所有内容在计算机内存中都是以二进制的形式储存的(即:0或1),简单来说位运算就是直接对在内存中的二进制数的每位进行运算操作. 二.学习前先了解一下有哪些运算,运算符都怎么 ...

  3. CKEditor4.7怎样实现上传图片,浏览服务器(无需ckfinder),nodejs图片管理,字体居中,图片居中(超详细)

    首先是下载CKEditor,下载地址:http://ckeditor.com/download 选择里面的Customize自定义,如图 然后进入配置界面,第一个choose preset一般就选st ...

  4. 组件化思路:以selection为例子,使用prop-types实现组件化控制,重用

    需求 书接上文,UI 积累之select section 这里又来两个需求了. 当我点击选择了option后,我应该看到的是我选择的option的内容 多例重用,即同样是个selection,我只是需 ...

  5. CentOS下安装Anaconda和pycharm

    前情提要:Linux越来越受大家喜爱,而在Linux中有一个社区很活跃的系统:那就是CentOS:而Anaconda又是几乎就一劳永逸的,你装了它之后基本上很多类库就不用再装了.然后就是pycharm ...

  6. Sketchup二次开发教程

    Sketchup提供了两套API: C API,主要用于读写SU文件.我们的SU文件导入功能就是用这套API做的 Ruby API,用于开发SU插件 这次我们主要关注Ruby API,因为它是实现更丰 ...

  7. 3DGIS与BIM集成集成技术及铁路桥梁可视化系统

    3DGIS与BIM的集成技术 3DGIS与BIM的集成技术包括2部分:一是将Revit软件生成的BIM针对3DGIS的快速无损格式转换,这种转换包括几何信息(如形状.位置等信息)和属性信息(如建筑信息 ...

  8. js实践篇:例外处理Try{}catch(e){}

    本文转载至:http://blog.csdn.net/ocean20/article/details/7301008 程序开发中,编程人员经常要面对的是如何编写代码来响应错误事件的发生,即例外处理(e ...

  9. 深入理解计算机系统 (CS:APP) Lab2 - Bomb Lab 解析

    原文地址:https://billc.io/2019/04/csapp-bomblab/ 写在前面 CS:APP是这学期的一门硬核课程,应该是目前接触到最底层的课程了.学校的教学也是尝试着尽量和CMU ...

  10. ico制作工具

    因为要满足不同尺寸的图标很多网站生成的ico都是单一尺寸的无法满足特殊要求因此推荐一个ICO制作工具 Axialis IconWorkshop 6.91 下载:https://www.axialis. ...