TOP-K Problems
最小的K个数
- 直接数组排序,取出前K个。复杂度\(O(nlogn)\)。
- 分治
此题只要求出最小的K个数,并不要求这K个数有序。
我们可以借鉴快排中的partition做法,将比第K个数小的都放前面,其余都放后面,即得到答案,但是这种方法会改变原有数组:
class Solution {
public:
vector<int> topKMin(vector<int>& nums, int k) {
if (k < 1 || k > nums.size()) {
return {};
}
int start = 0, end = nums.size() - 1;
int index = partition(nums, start, end);
while (index != k - 1) {
if (index > k - 1) {
end = index - 1;
index = partition(nums, start, end);
}
else {
start = index + 1;
index = partition(nums, start, end);
}
}
return vector<int>(begin(nums), begin(nums) + k);
}
private:
int partition(vector<int>& nums, int l, int r) {
if(nums.empty() || l < 0 || r >= nums.size())
return -1;
int pivotIndex = randomNum(l, r);
swap(nums[pivotIndex], nums[r]);
int smaller = l - 1;
for (int i = l; i < r; ++i) {
if (nums[i] <= nums[r]) {
++smaller;
swap(nums[smaller], nums[i]);
}
}
++smaller;
swap(nums[smaller], nums[r]);
return smaller;
}
int randomNum(int x, int y) {
srand(time(0)); // use system time as seed
return x + rand() % (y - x + 1);
}
};
可以得到递归关系:\(T(n)=T(n/2)+n\),由主定理可知复杂度\(O(n)\)。
与快排不同的是:快排要处理2个子问题,故为\(T(n)=2T(n/2)+n\),复杂度\(O(nlogn)\)。
关于复杂度,还可以用代入法证明:
\]
重复k次后:
\]
故:\(T(n)=n+n/2+n/4+...+1=2n+1\)
- 堆/红黑树
主要思路是用容器存储K个数,之后不断更新:如果当前值小于容器最大值,替换最大值。
用最大堆作为容器,删除及插入\(O(lgk)\),故总复杂度\(O(nlgk)\):
// max heap
class Solution {
public:
priority_queue<int> topKMin(vector<int>& nums, int k) {
if (k < 1 || k > nums.size()) {
return {};
}
priority_queue<int> q;
for (vector<int>::iterator it = nums.begin(); it != nums.end(); ++it) {
if (q.size() < k) {
q.push(*it);
}
else {
if (q.top() > * it) {
q.pop();
q.push(*it);
}
}
}
return q;
}
};
当然也可以使用红黑树:
// multiset
class Solution {
public:
vector<int> topKMin(vector<int>& nums, int k) {
if (k < 1 || k > nums.size()) {
return {};
}
multiset<int, greater<int>> ms;
for (vector<int>::iterator it = nums.begin(); it != nums.end(); ++it) {
if (ms.size() < k) {
ms.insert(*it);
}
else {
if (*ms.begin() > * it) {
ms.erase(ms.begin());
ms.insert(*it);
}
}
}
return vector<int>(ms.begin(), ms.end());
}
};
之所以说这种解法适用于海量数据,是因为很多时候不能一次性把数据读入内存处理,这种解法可以从硬盘一次读一个,判断是否放入容器即可,只需要在内存中存储容器即可。
最常出现的K个数
- 统计出现频率,排序后取出前K个。复杂度\(O(nlgn)\)。
- 最小堆。维护K个数,如果新数的频率大于堆顶,替换之。复杂度\(O(nlgk)\)。
class Solution {
public:
vector<int> topKFrequent(vector<int>& nums, int k) {
vector<int> ans;
unordered_map<int, int> cnt;
for (int i = 0; i < nums.size(); ++i) {
++cnt[nums[i]];
}
priority_queue<pair<int, int>, vector<pair<int, int>>, greater<pair<int, int>>> q;
for (auto p : cnt) {
q.emplace(p.second, p.first);
if (q.size() > k) {
q.pop();
}
}
for (int i = 0; i < k;++i) {
ans.push_back(q.top().second);
q.pop();
}
return ans;
}
};
- 桶排。用很多桶记录不同频率到对应数字的映射。时间\(O(n)\),空间\(O(n)\)。
class Solution {
public:
vector<int> topKFrequent(vector<int>& nums, int k) {
vector<int> ans;
unordered_map<int, int> cnt;
int maxFre = 0;
for(const int i : nums) {
maxFre = max(maxFre, ++cnt[i]);
}
unordered_map<int, vector<int>> bucket; // freq -> nums
for(const auto& p : cnt) {
bucket[p.second].push_back(p.first);
}
for(int i = maxFre;i > 0;--i) {
for(int a : bucket[i]) {
ans.push_back(a);
if(ans.size() == k) {
return ans;
}
}
}
return ans;
}
};
TOP-K Problems的更多相关文章
- [LeetCode] Top K Frequent Elements 前K个高频元素
Given a non-empty array of integers, return the k most frequent elements. For example,Given [1,1,1,2 ...
- C#版(打败99.28%的提交) - Leetcode 347. Top K Frequent Elements - 题解
版权声明: 本文为博主Bravo Yeung(知乎UserName同名)的原创文章,欲转载请先私信获博主允许,转载时请附上网址 http://blog.csdn.net/lzuacm. C#版 - L ...
- [LeetCode] 347. Top K Frequent Elements 前K个高频元素
Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [ ...
- 【leetcode】347. Top K Frequent Elements
题目地址:https://leetcode.com/problems/top-k-frequent-elements/ 从一个数组中求解出现次数最多的k个元素,本质是top k问题,用堆排序解决. 关 ...
- 【LeetCode】692. Top K Frequent Words 解题报告(Python)
[LeetCode]692. Top K Frequent Words 解题报告(Python) 标签: LeetCode 题目地址:https://leetcode.com/problems/top ...
- Leetcode 347. Top K Frequent Elements
Given a non-empty array of integers, return the k most frequent elements. For example,Given [1,1,1,2 ...
- 大数据热点问题TOP K
1单节点上的topK (1)批量数据 数据结构:HashMap, PriorityQueue 步骤:(1)数据预处理:遍历整个数据集,hash表记录词频 (2)构建最小堆:最小堆只存k个数据. 时间复 ...
- LeetCode "Top K Frequent Elements"
A typical solution is heap based - "top K". Complexity is O(nlgk). typedef pair<int, un ...
- [IR] Ranking - top k
PageRanking 通过: Input degree of link "Flow" model - 流量判断喜好度 传统的方式又是什么呢? Every term在某个doc中的 ...
- 347. Top K Frequent Elements
Given a non-empty array of integers, return the k most frequent elements. For example,Given [1,1,1,2 ...
随机推荐
- scratch算立方根
10((1/3)lgx)=x(1/3)也就是立方根
- ssh配置文件最佳实践(伪)
时间:2019-09-11 说明:以下配置是基于常用安全设置,并增加阿里云要求的安全参数而成 版本:第一版 # 1.监听相关 ## 指定ssh端口 Port 1314 ## 只监听网络协议 Addre ...
- 总结关于Mac上使用MySQL一些常见的问题
Num 1. MySQL5.7导出数据时提示--secure-file-priv解决办法: 问题分析 在官方的文档中,对secure_file_priv进行了说明,它用于限制数据的导出. secur ...
- CH5105 Cookies (线性dp)
传送门 解题思路: 贪心的想,贪婪值越大的孩子应该分得更多的饼干,那么先sort一遍在此基础上进行dp.最直观的方向,可以设dp[i][j]为前i个孩子一共分得j块饼干的怨恨最小值.然后转移第i+1个 ...
- 同步工具类—— CountDownLatch
本博客系列是学习并发编程过程中的记录总结.由于文章比较多,写的时间也比较散,所以我整理了个目录贴(传送门),方便查阅. 并发编程系列博客传送门 CountDownLatch简介 CountDownLa ...
- DVWA渗透笔记
Command Injection Low <?php if( isset( $_POST[ 'Submit' ] ) ) { // Get input $target = $_REQUEST[ ...
- AJ学IOS 之微博项目实战(12)发送微博自定义工具条代理实现点击事件
AJ分享,必须精品 一:效果 二:封装好的工具条 NYComposeToolbar.h 带代理方法 #import <UIKit/UIKit.h> typedef enum { NYCom ...
- AJ学IOS(30)UI之Quartz2D画图片画文字
回头看了看自己写的博客,AJ决定以后更改风格 本意是想大家看效果直接拷贝代码能用,注释齐全也方便学习,但是发现这样对新手学习特别困难 以后风格基本是–>看标题–>看目录–>看图片–& ...
- Linux-设备
一.在Linux系统中,每个设备都被当成一个文件来对待. 在Linux系统中,几乎所有的硬件设备都在/dev这个目录内.
- ChaosBlade--动态脚本实现 Java 实验场景
动态脚本实现 : 参考文档:https://github.com/chaosblade-io/chaosblade/wiki/%E5%8A%A8%E6%80%81%E8%84%9A%E6%9C%AC% ...