1.取上中位数

题目

给定两个有序数组arr1和arr2,两个数组长度都为N,求两个数组中所有数的上中位数。要求:时间复杂度O(logN)。

     例如:

         arr1 = {1,2,3,4};

         arr2 = {3,4,5,6};

         一共8个数则上中位数是第4个数,所以返回3。



         arr1 = {0,1,2};

         arr2 = {3,4,5};

         一共6个数则上中位数是第3个数,所以返回2。

思路

     (1)假设两个数组长度为偶数,取中间节点index=1
1  2  3  4
1‘ 2’ 3‘ 4’
若2 == 2‘ ,则直接返回;
若2 > 2', 说明 2 至少排第4, 所以3,4可以排除,1’ 2‘(2’ 最多排第3)可以排除,所以对剩下的1 2和3‘ 4’ 递归
若2 < 2‘,同理递归1’ 2‘和3、4.
      (2)假设两个数组长度为奇数,取中间节点index=2.
1  2  3  4  5
1‘ 2’ 3‘ 4’ 5’
若3 == 3‘ ,则直接返回;
若3 > 3', 说明 3 至少排第6, 所以4,5可以排除,1’ 2‘(2’ 最多排第4)可以排除,所以对剩下的1 2 3和 3‘ 4’  5‘递归,其实3也能排除,但是为了保证两个数组的长度一样,保留3
若3 < 3‘,同理递归1’ 2‘ 3’和3、4 、5.

代码

int getUpMedian(const vector<int> & arr1, int start1, int end1,const vector<int> & arr2, int start2, int end2) {

            if(start1 == end1)
return min(arr1[start1], arr2[start2]); int size = end1-start1+1;
int halfSize; if(size&1 == 1)//奇
halfSize = (size + 1)/2;
else//偶
halfSize = size/2; if(arr1[start1+halfSize - 1] == arr2[start2 + halfSize - 1])
return arr1[start1 + halfSize - 1];
else if(arr1[start1 + halfSize - 1] > arr2[start2 + halfSize - 1])
return getUpMedian(arr1,start1,start1+halfSize-1,arr2,end2-(halfSize-1),end2);
else
return getUpMedian(arr1,end1-(halfSize-1),end1,arr2,start2,start2+halfSize -1);
} int getUpMedian(vector<int> arr1, vector<int> arr2) {//主函数 if(arr1.size() != arr2.size())
return -1;
if(arr1.size() == 0)
return -1;
return getUpMedian1(arr1,0,arr1.size()-1,arr2,0,arr1.size() -1 );
}

2.取不等长有序数组的最小K个数

题目

给定两个有序数组arr1和arr2,在给定一个整数k,返回两个数组的所有数中第K小的数。要求:如果arr1的长度为N,arr2的长度为M。要求时间复杂度达到O(log(min{M,N}))

      例如:arr1 = {1,2,3,4,5};arr2 = {3,4,5};K = 1; 因为1为所有数中最小的,所以返回1;

                 arr1 = {1,2,3};arr2 = {3,4,5,6};K = 4;因为3为所有数中第4小的数,所以返回3;

思路

分三种情况考虑,假设arr1的长度N小于等于arr2的长度M

(1)若K<=N

结果为 arr1[0---K-1]和arr2[0---K-1]取中位数

(2)若 N<K<=M。先将arr2分为[0--K-N-1],[K-N-----K-1],[K,M-1]三部分

当arr2[K-N-1]>=arr1[N-1],结果为arr2[K-N-1]

否则,arr2[0--K-N-1]部分的所有数据一定至多在K-1位置(极端情况下,arr1[N]占据K位置)。而arr2[K,M-1]区间段的元素至少在K+1位置。因此结果对长度为N的两段区间段arr1[0,N-1]和arr2[K-N,K-1]取中位数即可。

(3)若K>M>N。先将划分arr1[0,K-M-1][K-M,N-1]两段区间,arr2[0,K-N-1][K-N,M-1]

当arr2[K-N-1]>=arr1[N-1],结果为arr2[K-N-1]

当arr1[K-M-1]>=arr2[M-1],结果为arr1[K-M-1]

两者不满足的话。则如前所叙述,arr1[0,K-M-1]和arr2[0,K-N-1]的元素都在位置K之前,至多为K-1。因此结果为长度为M+N-K的两段区间arr1[K-M,N-1]和arr2[K-N,M-1]的中位数。

时间复杂度最大为情况(2),即为所要求。

代码

int findKthNum(vector<int> arr1, vector<int> arr2, int kth)
{
int size1 = arr1.size();
int size2 = arr2.size(); if(size1 > size2)
return findKthNum(arr2, arr1, kth);//ensur if(kth <= size1)
return getUpMedian(arr1, 0, kth - 1, arr2, 0, kth - 1);//前k个,取中位数即可
else if (kth <= size2 && kth > size1)
{
if(arr2[kth - size1 - 1] >= arr1[size1 - 1] )
return arr2[kth - size1 - 1];
else
return getUpMedian(arr1, 0, size1-1, arr2, kth-size1, kth-1);
}
else
{
if(arr2[kth-size1-1] >= arr1[size1-1])
return arr2[kth-size1-1];
if(arr1[kth-size2-1] >= arr2[size2-1])
return arr1[kth-size2-1];
return getUpMedian(arr1, kth-size2, size1-1, arr2, kth-size1, size2-1);
} }

参考

   1.[nowCoder] 两个长度相同有序数组的中位数

每天一道算法题目(18)——取等长有序数组的上中位数和不等长有序数组的第k小的数的更多相关文章

  1. 一道算法题目, 二行代码, Binary Tree

    June 8, 2015 我最喜欢的一道算法题目, 二行代码. 编程序需要很强的逻辑思维, 多问几个为什么, 可不可以简化.想一想, 二行代码, 五分钟就可以搞定; 2015年网上大家热议的 Home ...

  2. 每天一道算法题(32)——输出数组中第k小的数

    1.题目 快速输出第K小的数 2.思路 使用快速排序的思想,递归求解.若键值位置i与k相等,返回.若大于k,则在[start,i-1]中寻找第k大的数.若小于k.则在[i+1,end]中寻找第k+st ...

  3. 算法---数组总结篇2——找丢失的数,找最大最小,前k大,第k小的数

    一.如何找出数组中丢失的数 题目描述:给定一个由n-1个整数组成的未排序的数组序列,其原始都是1到n中的不同的整数,请写出一个寻找数组序列中缺失整数的线性时间算法 方法1:累加求和 时间复杂度是O(N ...

  4. 算法总结之 在两个排序数组中找到第K小的数

    给定两个有序数组arr1 和 arr2 ,再给定一个int K,返回所有的数中第K小的数 要求长度如果分别为 N M,时间复杂度O(log(min{M,N}),额外空间复杂度O(1) 解决此题的方法跟 ...

  5. 查找第K小的数 BFPRT算法

    出处 http://blog.csdn.net/adong76/article/details/10071297 BFPRT算法是解决从n个数中选择第k大或第k小的数这个经典问题的著名算法,但很多人并 ...

  6. [nowCoder] 两个不等长数组求第K大数

    给定两个有序数组arr1和arr2,在给定一个整数k,返回两个数组的所有数中第K小的数.例如:arr1 = {1,2,3,4,5};arr2 = {3,4,5};K = 1;因为1为所有数中最小的,所 ...

  7. 快速排序以及第k小元素的线性选择算法

    简要介绍下快速排序的思想:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此 ...

  8. YTU 2420: C语言习题 不等长字符串排序

    2420: C语言习题 不等长字符串排序 时间限制: 1 Sec  内存限制: 128 MB 提交: 460  解决: 239 题目描述 在主函数中输入n(n<=10)个不等长的字符串.用另一函 ...

  9. BFPRT算法(求第K小的数字)

    BFPRT算法: 1.介绍: BFPRT算法又叫中位数的中位数算法,主要用于在无序数组中寻找第K大或第K小的数,它的最坏时间复杂度为O(n),它是由Blum,Floyd,Pratt,Rivest,Ta ...

随机推荐

  1. TCP/IP详解学习笔记(4)-ICMP协议,ping和Traceroute【转】

    转自:http://blog.csdn.net/goodboy1881/article/details/670761 1.IMCP协议介绍 前面讲到了,IP协议并不是一个可靠的协议(是一种尽力传送的协 ...

  2. hive从查询中获取数据插入到表或动态分区

    Hive的insert语句能够从查询语句中获取数据,并同时将数据Load到目标表中.现在假定有一个已有数据的表staged_employees(雇员信息全量表),所属国家cnty和所属州st是该表的两 ...

  3. [转载]java读写word文档,完美解决方案

    做项目的过程中,经常需要把数据里里的数据读出来,经过加工,以word格式输出. 在网上找了很多解决方案都不太理想,偶尔发现了PageOffice,一个国产的Office插件,开发调用非常简单!比网上介 ...

  4. 【WCF】利用WCF实现上传下载文件服务

    引言     前段时间,用WCF做了一个小项目,其中涉及到文件的上传下载.出于复习巩固的目的,今天简单梳理了一下,整理出来,下面展示如何一步步实现一个上传下载的WCF服务. 服务端 1.首先新建一个名 ...

  5. New Concept English three (55)

    28w/m 45errors Recent developments in astronomy have made it possible to detect planets in our won M ...

  6. Rational Rose 2003 下载、破解及安装方法(图文)

    方法一: 1. 安装Rational Rose2003时,在需选择安装项的时候,只选择Rational Rose EnterPrise Edition即可,不需选择其他项,之后选择“DeskTop I ...

  7. BZOJ - 2243 染色 (树链剖分+线段树+区间合并)

    题目链接 线段树维护区间连续段个数即可.设lc为区间左端点颜色,rc为区间右端点颜色,则合并两区间的时候,如果左区间右端点和右区间左端点颜色相同,则连续段个数-1. 在树链上的区间合并可以定义一个结构 ...

  8. UVA - 10570 Meeting with Aliens (置换的循环节)

    给出一个长度不超过500的环状排列,每次操作可以交换任意两个数,求把这个排列变成有序的环状排列所需的最小操作次数. 首先把环状排列的起点固定使其成为链状排列a,枚举排好序时的状态b(一种有2n种可能) ...

  9. zookeeper安装搭建

    一  zookeeper介绍 因为要使用kafka,但是不想用kafka自带的,而且考虑到后面别的地方需要使用,比如分布式job,觉得独立的比较好. zookeeper目前资料一大把,但是一是我需要锻 ...

  10. RabbitMQ用户角色及权限控制(不错)

    ########################用户角色####################### RabbitMQ的用户角色分类:none.management.policymaker.moni ...