问题:

在未排序的数组中找到第 k 个最大的元素。请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。

示例 1:

输入: [3,2,1,5,6,4] 和 k = 2
输出: 5
示例 2:

输入: [3,2,3,1,2,4,5,5,6] 和 k = 4
输出: 4
说明:

你可以假设 k 总是有效的,且 1 ≤ k ≤ 数组的长度。

解答:

这道题属于一个很经典的问题,即求数据集中的最大第k个或者最小的前k个之类。

常规方法有以下几种:

1.排序:

O(n logn)。

2.堆(该方法尤其适用于海量数据,因为内存中只需要维护k大小的堆,其他方法需要把海量数据全部移到内存中进行操作):

O(n log k)

用一个大小为k的堆,如果是求第k大,那么我们使用最小堆(为什么是最小堆看不懂没关系,这就说)。比如一个数据集有n个元素,假设我们(神奇的提前知道了!)最大的几个元素依次是x1,x2,x3,且x1、x2、x3都分布在数据集的后半部(假设n很大),而且k为3,即我们想求的就是x3。

步骤:

我们定义一个长度3的容器heap,先放入前3个数据,建立最小堆。然后我们从第4个元素开始遍历,每次遍历到一个元素nums[i],如果nums[i]>heap.top(),那么我们就pop掉当前的堆顶,并放入nums[i],重新维护最小堆性质。遍历完毕之后,最小堆的堆顶就是我们要求的数。

解释:

重申一次,我们想找的TOP-K,在本问题中就是前3大的数字。由于最小堆的堆顶是整个堆里最小的数字,所以如果有其他数字比这个堆顶大,说明这个堆顶一定不在最终的前3大数字里,所以我们理所当然的用当前数字去替换当前堆顶。

由于我们已经知道了x1、x2、x3是最大的三个数,遍历到他们时一定都有x1/x2/x3大于当时各自的堆顶从而push进堆,并且不可能有第4个数字比他们三个大从而把他们三个踢出堆。故最终堆里的三个数字就是x1、x2、x3,而且堆顶是三个数中最小的那个(x3),也就是我们想要的第3大的数。

时间复杂度为n logk,遍历n个元素,每次调整堆需要logk时间,在k比n小的情况下,比第一种排序算法节省大量时间。

容易理解,如果求第k小,那么我们对应的使用最大堆,解法完全一样。

代码:

 class Solution {
public:
int findKthLargest(vector<int>& nums, int k)
{
priority_queue<int,vector<int>,greater<int> >min_heap;
for(int num:nums)
{
min_heap.push(num);
if(min_heap.size()>k)
{
min_heap.pop();
}
}
return min_heap.top();
}
};

3.划分(partition):

O(n),将数组划分为左右两部分,如果中枢轴右侧元素大于k个,那对右侧区间继续划分,否则对左侧区间进行划分。

和快排的区别在于,快排划分之后,分别对左右子区间递归划分,时间是n+2*n/2+4*n/4+...=O(n logn)

该算法只会对一侧子区间进行递归划分,时间为n+n/2+n/4+n/8+...=O(n)

注意在取基准数的时候一定要随机化处理,否则时间效率会大大增加!

 class Solution {
public:
int findKthLargest(vector<int>& nums, int k)
{
srand(time());
return partition(nums,,nums.size()-,k);
}
int partition(vector<int>& nums,int le,int ri,int k){
if(le>=ri){
return k==?nums[le]:-;
}
int random_pos=rand()%(ri-le);
swap(nums[le+random_pos],nums[ri]);//随机化基准数,基准数为nums[ri]
int i=le-,j=le,stable=nums[ri];
while(j<ri){
if(nums[j]<stable){
swap(nums[++i],nums[j]);
}
++j;
}
swap(nums[i+],nums[ri]);
//i+1为划分枢轴
if(ri-i==k){
return nums[i+];
}
else if(ri-i>k){
return partition(nums,i+,ri,k);
}
else{
return partition(nums,le,i,k-ri+i);
}
}
};

基准数不加随机化:

基准数加随机化:

215. 数组中的第K个最大元素(TOP-K问题)的更多相关文章

  1. [Swift]LeetCode347. 前K个高频元素 | Top K Frequent Elements

    Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [ ...

  2. Java实现 LeetCode 215. 数组中的第K个最大元素

    215. 数组中的第K个最大元素 在未排序的数组中找到第 k 个最大的元素.请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素. 示例 1: 输入: [3,2,1,5,6 ...

  3. 215. 数组中的第K个最大元素 + 快速排序 + 大根堆

    215. 数组中的第K个最大元素 LeetCode-215 另一道类似的第k大元素问题:https://www.cnblogs.com/GarrettWale/p/14386862.html 题目详情 ...

  4. LeetCode 215——数组中的第 K 个最大元素

    1. 题目 在未排序的数组中找到第 k 个最大的元素.请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素. 示例 1: 输入: [3,2,1,5,6,4] 和 k = 2 ...

  5. 《剑指offer》第五十三题(数组中数值和下标相等的元素)

    // 面试题53(三):数组中数值和下标相等的元素 // 题目:假设一个单调递增的数组里的每个元素都是整数并且是唯一的.请编程实 // 现一个函数找出数组中任意一个数值等于其下标的元素.例如,在数组{ ...

  6. LeetCode 80 Remove Duplicates from Sorted Array II(移除数组中出现两次以上的元素)

    题目链接:https://leetcode.com/problems/remove-duplicates-from-sorted-array-ii/#/description 给定一个已经排好序的数组 ...

  7. javascript 数组中出现的次数最多的元素

    javascript 数组中出现的次数最多的元素 var arr = [1,-1,2,4,5,5,6,7,5,8,6]; var maxVal = arr[0]; // 数组中的最大值 var min ...

  8. 算法练习之合并两个有序链表, 删除排序数组中的重复项,移除元素,实现strStr(),搜索插入位置,无重复字符的最长子串

    最近在学习java,但是对于数据操作那部分还是不熟悉 因此决定找几个简单的算法写,用php和java分别实现 1.合并两个有序链表 将两个有序链表合并为一个新的有序链表并返回.新链表是通过拼接给定的两 ...

  9. 剑指offer——58数组中数值和下标相等的元素

    题目三: 数组中数值和下标相等的元素. 假设一个单调递增的数组里的每个元素都是整数并且是唯一的.请编程实现一个函数,找出数组中任意一个数值等于其下标的元素.例如,在数组{-3,-1,1,3,5}中,数 ...

  10. LeetCode题解 | 215. 数组中的第K个最大元素

    在未排序的数组中找到第 k 个最大的元素.请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素. 示例 1: 输入: [3,2,1,5,6,4] 和 k = 2 输出: 5 ...

随机推荐

  1. cf1176D

    题意简述:数组a经过一系列操作之后获得数组b,给你数组b,构造出一个满足条件的数组a 操作如下从左到右扫描数组a,如果是一个素数,那么把第这个素数的素数加到数组a中,例如a[1]=2那么加3到数组a当 ...

  2. 基于XML的声明式事务控制

    1.maven依赖 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="h ...

  3. [大数据技术]Kettle从CSV文件读取清洗后到MySQL中文乱码问题

    首先要知道CSV文件的编码格式 然后在文件输入编码选择编码格式, 第二步,在每个转换或者作业的DB连接中选择选项,并添加如下内容: 中文乱码问题得到解决

  4. python字符串前面加上'r'的作用

    在打开文件的时候open(r'c:\....') 加r和不加''r是有区别的 'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子 ...

  5. Uva1363(余数性质/减少枚举量)

    题意: 输入正整数n和k(范围均为1e9),求∑(k mod i),i从1~n 解法: 首先这道题直接暴力亲测会超时. 之后我们写几组数据之后可以发现当k/i的商相同的时候他们的余数成一个等差数列,而 ...

  6. 使用Scanner类

    import java.util.Scanner;   public class HelloWorld {     public static void main(String[] args) {   ...

  7. 2020省选模拟训练1 排列(perm)多项式exp+EGF

    这道题真的还是简单的一批..... 我当时要是参加考试的话该多好(凭这一道题就能进前 5 了) 十分显然的指数型生成函数. 令 $f[i]$ 表示有 $i$ 个点的答案. 然后显然有 $f[i]=\s ...

  8. 886. 求组合数 II(模板)

    数据范围较大, a,b都是1e5 直接根据公式预处理  1/i就是求i的逆元(逆元求法:mod为质数,逆元就是 i^(mod-2)%mod ) O(N*logN) import java.util.S ...

  9. 0级搭建类011-Oracle Linux 7.x安装(OEL 7.7) 公开

    项目文档引子系列是根据项目原型,制作的测试实验文档,目的是为了提升项目过程中的实际动手能力,打造精品文档AskScuti. 项目文档引子系列目前不对外发布,仅作为博客记录.如学员在实际工作过程中需提前 ...

  10. Postgresql Json Sql

    a detailed website about json sql query; official website: here, chinese version: here Json query: - ...