【LeetCode题解】347_前K个高频元素(Top-K-Frequent-Elements)
更多 LeetCode 题解笔记可以访问我的 github。
描述
给定一个非空的整数数组,返回其中出现频率前 k 高的元素。
示例 1:
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
示例 2:
输入: nums = [1], k = 1
输出: [1]
说明:
- 你可以假设给定的 k 总是合理的,且 1 ≤ k ≤ 数组中不相同的元素的个数。
- 你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。
解法一:排序算法(不满足时间复杂度要求)
拿到题目的时候,如果没有详细看说明的话,一般都会首先想到使用排序算法对元素按照频率由高到低进行排序,然后取前 \(k\) 个元素。但是这样做的时间复杂度是 \(O(n\log{n})\) 的, 不满足题目要求。虽然不满足题目要求,但是还是将求解程序写一下。
备注:在 LeetCode 中的运行时间也不是特别慢。
Java 实现
import java.util.Map;
import java.util.HashMap;
import java.util.List;
import java.util.ArrayList;
class Solution {
public List<Integer> topKFrequent(int[] nums, int k) {
// 统计元素的频率
Map<Integer, Integer> freqMap = new HashMap<>();
for (int num : nums) {
freqMap.put(num, freqMap.getOrDefault(num, 0) + 1);
}
// 对元素按照频率进行降序排序
List<Map.Entry<Integer, Integer>> list = new ArrayList<>(freqMap.entrySet());
Collections.sort(list, new Comparator<Map.Entry<Integer, Integer>>() {
@Override
public int compare(Map.Entry<Integer, Integer> o1, Map.Entry<Integer, Integer> o2) {
return o2.getValue() - o1.getValue();
}
});
// 取出前k个元素
int count = 0;
List<Integer> ret = new ArrayList<>();
for (Map.Entry<Integer, Integer> entry : list) {
ret.add(entry.getKey());
++count;
if (count >= k) {
break;
}
}
return ret;
}
}
// Runtime: 18 ms
// Your runtime beats 62.23 % of java submissions.
Python 实现
class Solution:
def topKFrequent(self, nums, k):
"""
:type nums: List[int]
:type k: int
:rtype: List[int]
"""
# 统计元素的频率
freq_dict = dict()
for num in nums:
freq_dict[num] = freq_dict.get(num, 0) + 1
# 按照频率进行排序
freq_dict_sorted = sorted(freq_dict.items(), key=lambda x: x[1], reverse=True)
# 取前k个元素返回
ret = list()
for i in range(k):
ret.append(freq_dict_sorted[i][0])
return ret
# Runtime: 52 ms
# Your runtime beats 71.83 % of python3 submissions.
复杂度分析
- 时间复杂度:\(O(n\log{n})\),其中 \(n\) 表示数组的长度。
- 空间复杂度:\(O(n)\),最极端的情况下(每个元素都不同),用于存储元素及其频率的 Map 需要存储 \(n\) 个键值对
解法二:最小堆
思路
进一步,为了满足时间复杂度要求,需要对解法一的排序过程进行改进。因为最终需要返回前 \(k\) 个频率最大的元素,可以想到借助堆这种数据结构。通过维护一个元素数目为 \(k\) 的最小堆,每次都将新的元素与堆顶端的元素(堆中频率最小的元素)进行比较,如果新的元素的频率比堆顶端的元素大,则弹出堆顶端的元素,将新的元素添加进堆中。最终,堆中的 \(k\) 个元素即为前 \(k\) 个高频元素。
Java 实现
class Solution {
public List<Integer> topKFrequent(int[] nums, int k) {
// 统计元素的频率
Map<Integer, Integer> map = new HashMap<>(16);
for (int num : nums) {
map.put(num, map.getOrDefault(num, 0) + 1);
}
// 遍历map,用最小堆保存频率最大的k个元素
PriorityQueue<Integer> pq = new PriorityQueue<>(new Comparator<Integer>() {
@Override
public int compare(Integer a, Integer b) {
return map.get(a) - map.get(b);
}
});
// PriorityQueue<Integer> pq = new PriorityQueue<>(
// (a, b) -> map.get(a) - map.get(b)
// );
for (Integer key : map.keySet()) {
if (pq.size() < k) {
pq.add(key);
} else if (map.get(key) > map.get(pq.peek())) {
pq.remove();
pq.add(key);
}
}
// 取出最小堆中的元素
List<Integer> ret = new ArrayList<>();
while (!pq.isEmpty()) {
ret.add(pq.remove());
}
return ret;
}
}
Python 实现
class Solution:
def topKFrequent(self, nums, k):
"""
:type nums: List[int]
:type k: int
:rtype: List[int]
"""
# 统计元素的频率
freq_dict = dict()
for num in nums:
freq_dict[num] = freq_dict.get(num, 0) + 1
# 维护一个大小为k的最小堆,使得堆中的元素即为前k个高频元素
pq = list()
for key, value in freq_dict.items():
if len(pq) < k:
heapq.heappush(pq, (value, key))
elif value > pq[0][0]:
heapq.heapreplace(pq, (value, key))
# 取出堆中的元素
ret = list()
while pq:
ret.append(heapq.heappop(pq)[1])
return ret
复杂度分析
- 时间复杂度:\(O(n\log{k})\),其中 \(n\) 表示数组的长度。首先,遍历一遍数组统计元素的频率,这一系列操作的时间复杂度是 \(O(n)\) 的;接着,遍历用于存储元素频率的 map,如果元素的频率大于最小堆中顶部的元素,则将顶部的元素删除并将该元素加入堆中,这一系列操作的时间复杂度是 \(O(n\log{k})\) 的;最后,弹出堆中的元素所需的时间复杂度是 \(O(k\log{k})\) 的。因此,总的时间复杂度是 \(O(n\log{k})\) 的。
- 空间复杂度:\(O(n)\),最坏情况下(每个元素都不同),map 需要存储 \(n\) 个键值对,优先队列需要存储 \(k\) 个元素,因此,空间复杂度是 \(O(n)\) 的。
解法三:桶排序(bucket sort)
思路
最后,为了进一步优化时间复杂度,可以采用桶排序(bucket sort),即用空间复杂度换取时间复杂度。
第一步和解法二相同,也是统计出数组中元素的频次。接着,将数组中的元素按照出现频次进行分组,即出现频次为 \(i\) 的元素存放在第 \(i\) 个桶。最后,从桶中逆序取出前 \(k\) 个元素。
Java 实现
class Solution {
public List<Integer> topKFrequent(int[] nums, int k) {
// 统计元素的频次
Map<Integer, Integer> int2FreqMap = new HashMap<>(16);
for (int num : nums) {
int2FreqMap.put(num, int2FreqMap.getOrDefault(num, 0) + 1);
}
// 桶排序
List<Integer>[] bucket = new List[nums.length + 1];
for (Integer key : int2FreqMap.keySet()) {
int freq = int2FreqMap.get(key);
if (bucket[freq] == null) {
bucket[freq] = new ArrayList<>();
}
bucket[freq].add(key);
}
// 逆序(频次由高到低)取出元素
List<Integer> ret = new ArrayList<>();
for (int i = nums.length; i >= 0 && ret.size() < k; --i) {
if (bucket[i] != null) {
ret.addAll(bucket[i]);
}
}
return ret;
}
}
Python 实现
class Solution:
def topKFrequent(self, nums, k):
"""
:type nums: List[int]
:type k: int
:rtype: List[int]
"""
# 统计元素的频率
freq_dict = dict()
for num in nums:
freq_dict[num] = freq_dict.get(num, 0) + 1
# 桶排序
bucket = [[] for _ in range(len(nums) + 1)]
for key, value in freq_dict.items():
bucket[value].append(key)
# 逆序取出前k个元素
ret = list()
for i in range(len(nums), -1, -1):
if bucket[i]:
ret.extend(bucket[i])
if len(ret) >= k:
break
return ret[:k]
复杂度分析
- 时间复杂度:\(O(n)\),其中 \(n\) 表示数组的长度。
- 空间复杂度:\(O(n)\)
【LeetCode题解】347_前K个高频元素(Top-K-Frequent-Elements)的更多相关文章
- [Swift]LeetCode347. 前K个高频元素 | Top K Frequent Elements
Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [ ...
- [Swift]LeetCode692. 前K个高频单词 | Top K Frequent Words
Given a non-empty list of words, return the k most frequent elements. Your answer should be sorted b ...
- LeetCode:前K个高频元素【347】
LeetCode:前K个高频元素[347] 题目描述 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 输出: [ ...
- Java实现 LeetCode 347 前 K 个高频元素
347. 前 K 个高频元素 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2] 示例 2: 输 ...
- leetcode 347. 前 K 个高频元素
问题描述 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2] 示例 2: 输入: nums ...
- Top K Frequent Elements 前K个高频元素
Top K Frequent Elements 347. Top K Frequent Elements [LeetCode] Top K Frequent Elements 前K个高频元素
- 前 K 个高频元素问题
前 K 个高频元素问题 作者:Grey 原文地址: 前 K 个高频元素问题 题目描述 LeetCode 347. Top K Frequent Elements 思路 第一步,针对数组元素封装一个数据 ...
- 代码题(3)— 最小的k个数、数组中的第K个最大元素、前K个高频元素
1.题目:输入n个整数,找出其中最小的K个数. 例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4. 快排思路(掌握): class Solution { public ...
- leetcode347. 前 K 个高频元素
题目最终需要返回的是前 kk 个频率最大的元素,可以想到借助堆这种数据结构,对于 kk 频率之后的元素不用再去处理,进一步优化时间复杂度. 具体操作为: 借助 哈希表 来建立数字和其出现次数的映射,遍 ...
随机推荐
- hdu 5099 简单模拟(比较型号)
http://acm.hdu.edu.cn/showproblem.php?pid=5099 比较两个安卓手机型号,水题 注意点:A is actually implicit and usually ...
- HDU3480_区间DP平行四边形优化
HDU3480_区间DP平行四边形优化 做到现在能一眼看出来是区间DP的问题了 也能够知道dp[i][j]表示前 i 个节点被分为 j 个区间所取得的最优值的情况 cost[i][j]表示从i ...
- CentOS ntp同步
新装的CentOS系统服务器可能设置了错误的,需要调整时区并调整时间. 如下是CentOS系统使用NTP来从一个时间服务器同步 把当前时区调整为上海就是+8区,想改其他时区也可以去看看/usr/sha ...
- 微擎开启redis memcache
微擎开启redis memcache 2018年01月20日 14:39:54 luogan129 阅读数:2161更多 个人分类: 微信开发 版权声明:本文为博主原创文章,未经博主允许不得转载. ...
- FastReport自动换行及行高自适应
- java 注释annotation学习---两篇不错的blog
深入理解Java:注解(Annotation)自定义注解入门 ---- http://www.cnblogs.com/peida/archive/2013/04/24/3036689.html 深入理 ...
- oracle查询语句查询增加一列内容
select a,sys_guid() as b from mytable sys_guid() 是生成带分隔符(-)的GUID的自定义函数 查询B表的内容插入A表,MY_ID是A表的主键不可为空,因 ...
- .NET MVC 学习笔记(六)— 数据导入
.NET MVC 学习笔记(六)—— 数据导入 在程序使用过程中,有时候需要新增大量数据,这样一条条数据去Add明显不是很友好,这时候最好就是有一个导入功能,导入所需要的数据,下面我们就一起来看一下导 ...
- Unity 屏幕外死亡的敌人的分数显示在屏幕内
在敌人死亡后,会出现分数,如果敌人死亡的位置在屏幕内,那么使得获得的分数显示在屏幕内,超出屏幕范围的,显示在屏幕外 当然,这里例子是使得场景中的物体显示在屏幕内,当然也可以使用纯粹的UGUI物体的显示 ...
- 使用jQuery实现一个类似GridView的编辑,更新,取消和删除的功能
先来看看下面实时效果演示: 用户点击编辑时,在点击行下动态产生一行.编辑铵钮变为disabled.新产生的一行有更新和取消的铵钮,点击“取消”铵钮,删除刚刚动态产生的行.编辑铵钮状态恢复. 更新与删除 ...