线性时间求取第 K 大数
求 Top K 的算法主要有基于快速排序的和基于堆的这两种,它们的时间复杂度都为 \(O(nlogK)\)。借助于分治思想,以及快速排序的区间划分,我们可以做到 \(O(n)\) 时间复杂度。具体算法思路如下:

- 第 1 步,我们将原数据 5 个一组划分为若干个组,最后余下的不足 5 个的额外作为一组,总组数为 \(g=\lceil{n/5}\rceil\);
- 第 2,3 步, 对每一个组内的 5 个元素利用插入排序算法进行排序,然后将每个组的中位数依次放到数据的前面,最后 \(A[0, g-1]\) 保存的便是 \(g\) 个组各自的中位数;
- 第 4 步,递归调用求出 \(A[0, g-1]\) 的中位数,也即是元素 \(A[g/2]\),不知是否可以直接得到;
- 第 5 步,以上一步得到的中位数对数据划分区间,左边小于中位数,右边大于中位数,中位数位于第 \(k\) 个位置;
- 第 6 步,如果我们要找的正好是第 \(k\) 大数,那么刚刚得到的中位数即为所求;
- 第 7 步,如果 \(i<k\) 我们要找的第 \(i\) 大数位于区间 \(A[0, k-1]\),在左半边递归求取第 \(i\) 大的数;
- 第 8 步,如果 \(i>k\) 我们要找的第 \(i\) 大数位于区间 \(A[k+1:-1]\),在右半边递归求取第 \(i-k\) 大的数。
def insert_sort(data, left, right):
# 对列表 data[left, right] 进行插入排序
for i in range(left+1, right+1):
num = data[i]
for j in range(i, left, -1):
if num < data[j-1]:
data[j] = data[j-1]
else:
break
data[j] = num
def swap(data, i, j):
# 交换列表 data 位于 i,j 的元素
temp = data[i]
data[i] = data[j]
data[j] = temp
def partition(data, x):
# 按照列表 data 第 x 个元素分区
n = len(data)
i = 0
pivot = data[x]
swap(data, x, n-1)
for j in range(0, n):
if data[j] < pivot:
swap(data, i, j)
i += 1
data[j] = data[i]
data[i] = pivot
return i
def select_ith_min(data, i):
# 选取列表 data 中第 i 小的元素
n = len(data)
# 不要忘了递归终止
if n == 1:
return data[0]
if n % 5 == 0:
group = n // 5
else:
group = n // 5 + 1
for j in range(0, group):
start = j * 5
end = start + 4
if end > n - 1:
end = n - 1
insert_sort(data, start, end)
mid = (end - start + 1) // 2 + start
swap(data, j, mid)
pivot = data[group // 2]
k = partition(data, group // 2)
if k == i-1:
return pivot
elif k > i-1:
return select_ith_max(data[0:k], i)
else:
return select_ith_max(data[k:], i-k)
a = [i for i in range(100, 0, -1)]
print(a)
for i in range(1, 101):
num = select_ith_max(a, i)
print(num)
获取更多精彩,请关注「seniusen」!

线性时间求取第 K 大数的更多相关文章
- POJ 2104 K-th Number ( 求取区间 K 大值 || 主席树 || 离线线段树)
题意 : 给出一个含有 N 个数的序列,然后有 M 次问询,每次问询包含 ( L, R, K ) 要求你给出 L 到 R 这个区间的第 K 大是几 分析 : 求取区间 K 大值是个经典的问题,可以使用 ...
- [csu/coj 1080]划分树求区间前k大数和
题意:从某个区间内最多选择k个数,使得和最大 思路:首先题目给定的数有负数,如果区间前k大出现负数,那么负数不选和更大,于是对于所有最优选择,负数不会出现,所以用0取代负数,问题便转化为区间的前k大数 ...
- 算法导论学习之线性时间求第k小元素+堆思想求前k大元素
对于曾经,假设要我求第k小元素.或者是求前k大元素,我可能会将元素先排序,然后就直接求出来了,可是如今有了更好的思路. 一.线性时间内求第k小元素 这个算法又是一个基于分治思想的算法. 其详细的分治思 ...
- [hdu3949]XOR(线性基求xor第k小)
题目大意:求xor所有值的第k小,线性基模板题. #include<cstdio> #include<cstring> #include<algorithm> #i ...
- 线性时间O(n)内求数组中第k大小的数
--本文为博主原创,转载请注明出处 因为最近做的WSN(wireless sensor network)实验要求用3个传感器节点接受2000个包的数据并算出一些统计量,其中就有算出中位数这么一个要求, ...
- 线性基求第k小异或值
题目链接 题意:给由 n 个数组成的一个可重集 S,每次给定一个数 k,求一个集合 \(T \subseteq S\), 使得集合 T 在 S 的所有非空子集的不同的异或和中, 其异或和 \(T_1 ...
- O(n)线性时间找第K大,中位数
运用快速排序的思想,可以达到线性时间找到一串数的第K大 #include<cstdio> #define F(i,a,b) for(int i=a;i<=b;i++) ],n; vo ...
- K:求取数组中最大连续子序列和的四个算法
相关介绍: 求取数组中最大连续子序列和问题,是一个较为"古老"的一个问题.该问题的描述为,给定一个整型数组(当然浮点型也是可以的啦),求取其下标连续的子序列,且其和为该数组的所有 ...
- HDU - 3949 :XOR(线性基,所有集合的不同异或和中,求从小到大第K个)
XOR is a kind of bit operator, we define that as follow: for two binary base number A and B, let C=A ...
随机推荐
- 在docker下运行mysql
docker pull mysql 从镜像仓库中拉取mysql镜像. 运行镜像 到此mysql在docker容器下运行成功. 使用Navicat连接工具连接到mysql 经过以上步骤就完成了在dock ...
- Xcode中常用的快捷键(原文链接http://www.cocoachina.com/ios/20141224/10752.html)
Xcode导航快捷键 1.工程导航器:Command+1 快速浏览代码.图片以及用户界面文件. 2.显示/隐藏导航器面板:Command+0 当你在对屏幕进行截图的时候可能会想要隐藏起与你感兴趣内容的 ...
- laravel 的lnmp 的配置
装了lnmp后,一般用 lnmp vhost add 添加网站 一般 只用重写和ssl功能 再发laravel官方的配置 server { listen 80; server_name example ...
- hostname - 显示或设置系统的主机名
NAME(名称) hostname - 显示或设置系统的主机名 domainname - 显示或设置系统的NIS/YP域名 dnsdomainname - 显示系统的DNS域名 nisdomainna ...
- Qualcomm_Mobile_OpenCL.pdf 翻译-5-性能优化的概述
这章提供了一个OpenCL应用程序优化的总体概述.更多的细节将会在接下来的章节中找到. 注意:OpenCL程序的优化是具有挑战性的.相比初始的程序开发工作,经常需要做更多的工作. 5.1 性能移植性 ...
- nginx反向代理+负载均衡+url重写+ssl认证
Nginx (engine x) 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.Nginx是由伊戈尔·赛索耶夫为俄罗斯访问量第二的Rambler.ru站点(俄 ...
- Java并发(基础知识)—— 创建、运行以及停止一个线程
在计算机世界,当人们谈到并发时,它的意思是一系列的任务在计算机中同时执行.如果计算机有多个处理器或者多核处理器,那么这个同时性是真实发生的:如果计算机只有一个核心处理器那么就只是表面现象. 现代所有的 ...
- 【vue2.x基础】用npm起一个完整的项目
1. 安装vue npm install vue -g 2. 安装vue-cli脚手架 npm install vue-cli -g 3. 安装webpack npm install webpack ...
- Python修炼之路-数据类型
Python编程之列表 列表是一个使用一对中括号"[ ]" 括起来的有序的集合,可以通过索引访问列表元素,也可以增加和删除元素. 列表的索引:第一个元素索引为0,最后一个元素索 ...
- Mapnik使用postgres中的栅格数据
XML: <?xml version="1.0" encoding="utf-8"?> <Map background-color=" ...