There are two sorted arrays nums1 and nums2 of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

看到这道题的通过率很诧异,感觉这道题挺容易的,因为其实它的思想还是很简单的。

1)最笨的方法去实现,利用排序将两个数组合并成一个数组,然后返回中位数,这种方法应该会超时。

2)利用类似merge的操作找到中位数,利用两个分别指向A和B数组头的指针去遍历数组,然后统计元素个数,直到找到中位数,此时算法复杂度为O(n)。

我一开始想到的就是2)这种方法,但是真正的写起代码来,才发现有很多的细节需要去考虑,挺繁琐的。

我们仅需要第k大的元素,不需要排序这个复杂的操作:可以定义一个计数器m,表示找到了第m大的元素;同时指针pa,pb分别指向数组A,B的第一个元素,使用merge-sort的方式,当A的当前元素小于B的当前元素时:pa++, m++,当*pb < *pa时,pb++, m++。最终当m等于k时,就得到了第k大的元素。时间复杂度O(k),但是当k接近于m+n时,复杂度还是O(m+n);

3)

从题目中的要求O(log(m+n))可以联想到肯定要用到二分查找的思想

那么有没有更好的方案?我们可以考虑从k入手。如果我们每次能够删除一个一定处于第k大元素之前的元素,那么需要进行k次。但是如果我们每次都能删除一半呢?可以利用A,B有序的信息,类似二分查找,也是充分利用有序。 
假设A 和B 的元素个数都大于k/2,我们将A 的第k/2 个元素(即A[k/2-1])和B 的第k/2个元素(即B[k/2-1])进行比较,有以下三种情况(为了简化这里先假设k 为偶数,所得到的结论对于k 是奇数也是成立的): 
- A[k/2 - 1] == B[k/2 - 1];

就是这里感觉不太明白,如果k==3,感觉怎么凑都不对啊!!!!!

解释:这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。
- A[k/2 - 1] > B[k/2 - 1]; 
- A[k/2 - 1] < B[k/2 - 1]; 
如果A[k/2 - 1] < B[k/2 - 1] ,意味着 A[0] 到 A[k/2 - 1] 的元素一定小于 A+B 第k大的元素。因此可以放心的删除A数组中的这k/2个元素; 
同理,A[k/2 - 1] > B[k/2 - 1];可以删除B数组中的k/2个元素; 
当A[k/2 - 1] == B[k/2 - 1] 时,说明找到了第k大的元素,直接返回A[k/2 - 1] 或B[k/2 - 1]的值。

因此可以写一个递归实现,递归终止条件是什么呢? 
- A或B为空时,直接返回A[k-1] 或 B[k-1] 
- 当k = 1时,返回min(A[0], B[0]) //第1小表示第一个元素 
- 当A[k/2 - 1] == B[k/2 - 1] 时,返回A[k/2 - 1] 或B[k/2 - 1]

我们可以看出,代码非常简洁,而且效率也很高。在最好情况下,每次都有k一半的元素被删除,所以算法复杂度为logk,由于求中位数时k为(m+n)/2,所以算法复杂度为log(m+n)。

转自:http://www.bubuko.com/infodetail-797383.html

最终实现的代码为(代码是直接拷贝的别人的,到时候还需要自己写一下):

    static int find_kth(int* A, int m,int* B, int n, int k);
static int min(p, q) {return (p < q) ? p : q;}
double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size) {
int m = nums1Size;
int n = nums2Size;
int total = m+n;
int k = total/2;
if(total & 0x01) { //这里用total%2==1也行
return find_kth(nums1, m, nums2, n, k+1); //奇数,返回唯一中间值
} else {
return (find_kth(nums1, m, nums2, n, k) + find_kth(nums1, m, nums2, n, k+1)) / 2.0; //偶数,返回中间2个的平均值
}
}
//找到A,B组合中第k小的值: AB[k-1]
int find_kth(int* A, int m,int* B, int n, int k) {
//假设m都小于n
if (m > n)
return find_kth(B, n, A, m, k);
if (m == 0)
return B[k-1];
if (k == 1) //终止条件
return min(A[0], B[0]); int i_a = min(m, k/2); //这两步的意义就是之前解释的遇到奇数时的情况
int i_b = k - i_a; if (A[i_a-1] < B[i_b-1])
return find_kth(A+i_a, m-i_a, B, n, k-i_a);
else if (A[i_a-1] > B[i_b-1])
return find_kth(A, m, B+i_b, n-i_b, k-i_b);
else
return A[i_a-1];
}

  下面是我更改的C++的版:

class Solution {
public:
int findk(vector<int>& nums1,int len1, vector<int>& nums2,int len2,int k)
{ if(len1>len2)
return findk(nums2,len2,nums1,len1,k);
if(len1==0)
return nums2[k-1];
if(k==1)
return min(nums1[0],nums2[0]);
int flag1=min(len1,k/2);
int flag2=k-flag1;
if(nums1[flag1-1]<nums2[flag2-1])
{
vector<int> temp(nums1.begin()+flag1,nums1.end());
return findk(temp,len1-flag1,nums2,len2,k-flag1);
}
else if(nums1[flag1-1]>nums2[flag2-1])
{
vector<int> temp(nums2.begin()+flag2,nums2.end());
return findk(nums1,len1,temp,len2-flag2,k-flag2);
} else
return nums1[flag1-1];
} double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int len1=nums1.size();
int len2=nums2.size();
int k=(len1+len2)/2;
if((len1+len2)%2==1)
return findk(nums1,len1,nums2,len2,k+1);
else
return (findk(nums1,len1,nums2,len2,k)+findk(nums1,len1,nums2,len2,k+1))/2.0;
}
};

  以下的是错误的,但是错在哪呢?

class Solution {
public:
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int len1=nums1.size();
int len2=nums2.size();
int mid=(len1+len2)/;
int res=;
if((len1+len2)%==)
res=getRes(nums1,len1,nums2,len2,mid+);
else
res=(getRes(nums1,len1,nums2,len2,mid)+getRes(nums1,len1,nums2,len2,mid+))/2.0;
return res;
}
double getRes(vector<int>& nums1, int len1,vector<int>& nums2,int len2,int mid)
{ if(len1<len2)
return getRes(nums2,len2,nums1,len1,mid);
if(len2==)
return nums1[mid-];
if(mid==)
return min(nums1[],nums2[]);
int k1=min(len2,mid/);
int k2=mid-k1;
int res=;
if(nums1[k1-]<nums2[k2-])
{
vector<int> temp( nums1.begin()+k1,nums1.end());
res=getRes(temp,len1-k1,nums2,len2,mid-k1);
}
else if(nums1[k1-]>nums2[k2-])
{
vector<int> temp( nums2.begin()+k2,nums2.end());
res=getRes(nums1,len1,temp,len2-k2,mid-k2);
}
else
res= nums1[k1-];
return res;
} };

Median of Two Sorted Arrays——算法课上经典的二分和分治算法的更多相关文章

  1. 【算法之美】求解两个有序数组的中位数 — leetcode 4. Median of Two Sorted Arrays

    一道非常经典的题目,Median of Two Sorted Arrays.(PS:leetcode 我已经做了 190 道,欢迎围观全部题解 https://github.com/hanzichi/ ...

  2. Kotlin实现LeetCode算法题之Median of Two Sorted Arrays

    题目Median of Two Sorted Arrays(难度Hard) 方案1,数组合并&排序调用Java方法 import java.util.* class Solution { fu ...

  3. 周刷题第二期总结(Longest Substring Without Repeating Characters and Median of Two Sorted Arrays)

    这周前面刷题倒是蛮开心,后面出了很多别的事情和问题就去忙其他的,结果又只完成了最低目标. Lonest Substring Without Repeating Characters: Given a ...

  4. [LintCode] Median of Two Sorted Arrays 两个有序数组的中位数

    There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted ...

  5. LeetCode(3) || Median of Two Sorted Arrays

    LeetCode(3) || Median of Two Sorted Arrays 题记 之前做了3题,感觉难度一般,没想到突然来了这道比较难的,星期六花了一天的时间才做完,可见以前基础太差了. 题 ...

  6. LeetCode 4. Median of Two Sorted Arrays & 归并排序

    Median of Two Sorted Arrays 搜索时间复杂度的时候,看到归并排序比较适合这个题目.中位数直接取即可,所以重点是排序. 再来看看治阶段,我们需要将两个已经有序的子序列合并成一个 ...

  7. 【LeetCode】4. Median of Two Sorted Arrays (2 solutions)

    Median of Two Sorted Arrays There are two sorted arrays A and B of size m and n respectively. Find t ...

  8. 《LeetBook》leetcode题解(4): Median of Two Sorted Arrays[H]——两个有序数组中值问题

    我现在在做一个叫<leetbook>的免费开源书项目,力求提供最易懂的中文思路,目前把解题思路都同步更新到gitbook上了,需要的同学可以去看看 书的地址:https://hk029.g ...

  9. Leetcode 4. Median of Two Sorted Arrays(二分)

    4. Median of Two Sorted Arrays 题目链接:https://leetcode.com/problems/median-of-two-sorted-arrays/ Descr ...

随机推荐

  1. 20165218 2017-2018-2 《Java程序设计》课程总结

    20165218 2017-2018-2 <Java程序设计>课程总结 一.每周作业链接汇总 20165218 我期望的师生关系 20165218 学习基础和C语言基础调查 2016521 ...

  2. bzoj3884: 上帝与集合的正确用法(数论)

    感觉是今天洛谷月赛T3的弱化版,会写洛谷T3之后这题一眼就会写了... 还是欧拉扩展定理 于是就在指数上递归%phi(p)+phi(p)直到1,则后面的指数就都没用了,这时候返回,边回溯边快速幂.因为 ...

  3. 【单调栈】【CF5E】 Bindian Signalizing

    传送门 Description 给你一个环,环上有一些点,点有点权.定义环上两点能相互看见当且仅当两点间存在一个弧使得弧上不存在一个点的点权大于着两个点.求一共有多少个点能互相看到 Input 第一行 ...

  4. css样式表设置

    有参考此片博文 1.内联式样式表 是指将CSS样式编码写在HTML标签中,在标签内编写的样式能影响的范围最小,只改变本标签的文字样式,同样的标签不会受到影响,也称行间样式表. 格式如下 <h1 ...

  5. 图像处理之直方图均衡化及C源码实现

    1 直方图均衡化(Histogram Equalization)简介 图像对比度增强的方法可以分成两类:一类是直接对比度增强方法;另一类是间接对比度增强方法.直方图拉伸和直方图均衡化是两种最常见的间接 ...

  6. C/C++中如何计算程序运行的时间

    一个程序的功能通常有很多种方法来实现,怎么样的程序才算得上最优呢?举个例子,如果实现同一个功能的两个程序,一个一点按钮就给出运行结果,而另一个则需要漫长的时间去等待,就像安装WINDOWS XP一样( ...

  7. HDU 3480 斜率dp

    Division Time Limit: 10000/5000 MS (Java/Others)    Memory Limit: 999999/400000 K (Java/Others)Total ...

  8. Ubuntu 使用Compiz配置炫酷3D桌面

    先看一下效果 要实现这种3D 的效果其实很简单. Step 1:安装N卡驱动工具 sudo apt- 这个东西其实没有太大的作用. Step 2:安装Compiz sudo apt-get insta ...

  9. HAOI2017游记

    HACF的最终成绩已经出炉,但是事情还没有结束. 好多想说的,不知道从何说起,就按照时间顺序说吧. 考前 考前大概一周半就开始复习了,一些比较重要的算法,比如KDT,单纯性,线性基等等没有再继续学,所 ...

  10. K-means的缺点(优化不仅仅是最小化误差)

    K-means的缺点(优化不仅仅是最小化误差) #转载时,请注明英文原作David Robinson,译者Ding Chao.# 我最近遇到一个交叉验证的问题,我认为这个给我提供了一个很好的机会去用“ ...