BFPRT算法(求第K小的数字)
BFPRT算法:
1.介绍:
BFPRT算法又叫中位数的中位数算法,主要用于在无序数组中寻找第K大或第K小的数,它的最坏时间复杂度为O(n),它是由Blum,Floyd,Pratt,Rivest,Tarjan提出,它的思想是修改快速选择算法(快排)的主元选取方法,提高在最坏情况下的时间复杂度。
2.具体方法:
BFPRT算法主要由两部分组成:快排和基准选取函数。基准选取函数就是中位数的中位数算法的实现,具体来说--就是讲快排的基准选取策略进行了优化,改为每次尽可能的选择中位数作为基准。
所以说算法的核心就是通过基准选取函数找一个合理的划分值,然后就是快排的Partition过程,判断等于区域(利用区域的下标进行判断)是否命中k,否则向两边其中一边递归。
实现过程:
1.将给定的数组‘arr[N]’划分为多个小组,每5个一组,小于5个的单独成组,只是在逻辑上对数组进行了分组,时间复杂度为O(N)
2.每个组进行组内排序,对5个数的排序时间是O(1),只保证组内有序,共有N/5个组,时间复杂度:O(1)*N/5=O(N).
3.得到每个组的“上中位数”,在组成新的数组newarr[](未必有序),长度是N/5。
[上中位数]:
对于奇数个数,就是中位数,比如 1 2 3 4 5,中位数:3
对于偶数个数,为前一个数,比如 1 2 3 4 ,中位数为:2
4.然后求得newarr[]的中位数,即中位数的中位数mm,作为划分值。
5.Partition过程:时间复杂度:O(N).
6.判断快排后左右指针重合的位置i+1是否等于k,大于则向右递归,小于则向左递归。
看完算法的过程,我们知道主要有这些函数:1.求中位数,2.Partition函数,3.插入排序函数(被求中位数函数调用),4.求key(即中位数的中位数)。
#include <iostream>
#include <vector>
using namespace std;
int GetMedian(vector<int>a,int begin, int end);
int medianOfMedians(vector<int>a, int begin, int end);
void InsertSort(vector<int>&a,int begin, int end);
int select(vector<int>&a, int begin, int end, int K);
int Get_MinKnum_By_BFPRT(vector<int>&a,int K);
vector<int> Partition(vector<int>&a, int l,int r, int pKey);
int main()
{
printf("初始数组a中的元素:");
for(int i = 0; i<a.size();++i)
cout<<a[i]<<" ";
cout<<"\n\n";
printf(" Get_MinKnum_By_BFPRT 获得的第5大的数是:%d\n\n",Get_MinKnum_By_BFPRT(a,5));
printf("用于检验:数组a排序后的元素:");
InsertSort(a,0,a.size()-1);
for(int i = 0; i<a.size();++i)
cout<<a[i]<<" ";
cout<<"\n\n";
return 0;
}
//插入排序(为了求取中位数)
void InsertSort(vector<int>&a,int begin,int end)
{
if(begin == end) return;
for (int i = begin+1; i != end+1; ++i)
{
for (int j = i - 1; j >= begin ; j--)
{
if(a[j+1] < a[j])
swap(a[j],a[j+1]);
else
break;
}
}
}
//获取中位数
int GetMedian(vector<int>a,int begin, int end)
{
InsertSort(a,begin,end);
int sum = begin+end;
int mid = (sum/2) + (sum%2);
return a[mid];
}
//Partition过程
vector<int> Partition(vector<int>&a, int l,int r, int pKey)
{
int less = l-1;
int more = r+1;
int pos = l;
while(pos < more)
{
if(a[pos] < pKey){
swap(a[++less],a[pos++]);
}else if (a[pos] > pKey){
swap(a[--more],a[pos]);
}else{
pos++;
}
}
std::vector<int> range;
range.push_back(less+1);
range.push_back(more-1);
return range;
}
//求取划分值pKey,中位数数组的中位数
int medianOfMedians(vector<int>a, int begin, int end)
{
int num = end-begin+1;
int offset = num % 5 == 0 ? 0 : 1; //用于不足5个元素自成一组
std::vector<int> newarr(num/5+offset);
for (int i = 0; i < newarr.size(); ++i)
{
int beginI = begin + i*5;
int endI = beginI + 4;
//GetMedian()是获取每组的中位数,之后存到新数组中
newarr[i] = GetMedian(a,beginI,min(end,endI)); //取min值是因为要处理不足5个一组的情况
}
return select(newarr,0,newarr.size()-1,newarr.size()/2); //获取newarr[]的中位数
//递归的调用自己求上中位数
}
//select函数:给定一个数组和范围,求位于第k位置上的数
int select(vector<int>&a, int begin, int end, int K)
{
if(begin == end)
return a[begin];
int pKey = medianOfMedians(a,begin,end);
vector<int> range = Partition(a,begin,end,pKey);
if (K >= range[0] && K <= range[1]){
return a[K];
}
else if (K < range[0]) {
return select(a, begin, range[0]-1, K);
}
else {
return select(a, range[1] + 1, end, K);
}
}
int Get_MinKnum_By_BFPRT(vector<int>&a,int K)
{
return select(a,0,a.size()-1,K-1);
}
读到这里大家肯定还是一知半解,很多地方还是云里雾里,例如为甚吗一定要将数组划分为N/5,这个我也不是很明白,有兴趣的可以看看BFPRT算法原理,讲的更加深入.
BFPRT算法(求第K小的数字)的更多相关文章
- 算法导论学习之线性时间求第k小元素+堆思想求前k大元素
对于曾经,假设要我求第k小元素.或者是求前k大元素,我可能会将元素先排序,然后就直接求出来了,可是如今有了更好的思路. 一.线性时间内求第k小元素 这个算法又是一个基于分治思想的算法. 其详细的分治思 ...
- 数组中第K小的数字(Google面试题)
http://ac.jobdu.com/problem.php?pid=1534 题目1534:数组中第K小的数字 时间限制:2 秒 内存限制:128 兆 特殊判题:否 提交:1120 解决:208 ...
- 九度OJ 1534 数组中第K小的数字 -- 二分查找
题目地址:http://ac.jobdu.com/problem.php?pid=1534 题目描述: 给定两个整型数组A和B.我们将A和B中的元素两两相加可以得到数组C. 譬如A为[1,2],B为[ ...
- 九度OJ 题目1534:数组中第K小的数字(二分解)
题目链接:点击打开链接 题目描述: 给定两个整型数组A和B.我们将A和B中的元素两两相加可以得到数组C. 譬如A为[1,2],B为[3,4].那么由A和B中的元素两两相加得到的数组C为[4,5,5,6 ...
- 九度 1534:数组中第K小的数字(二分法变形)
题目描述: 给定两个整型数组A和B.我们将A和B中的元素两两相加可以得到数组C.譬如A为[1,2],B为[3,4].那么由A和B中的元素两两相加得到的数组C为[4,5,5,6].现在给你数组A和B,求 ...
- 题目1534:数组中第K小的数字 ——二分
http://ac.jobdu.com/problem.php?pid=1534 给定两个整型数组A和B.我们将A和B中的元素两两相加可以得到数组C.譬如A为[1,2],B为[3,4].那么由A和B中 ...
- 九度oj 题目1534:数组中第K小的数字
题目描述: 给定两个整型数组A和B.我们将A和B中的元素两两相加可以得到数组C. 譬如A为[1,2],B为[3,4].那么由A和B中的元素两两相加得到的数组C为[4,5,5,6]. 现在给你数组A和B ...
- 求第k小的数
题目链接:第k个数 题意:求n个数中第k小的数 题解: //由快速排序算法演变而来的快速选择算法 #include<iostream> using namespace std; const ...
- 树状数组求第k小的元素
int find_kth(int k) { int ans = 0,cnt = 0; for (int i = 20;i >= 0;i--) //这里的20适当的取值,与MAX_VAL有关,一般 ...
随机推荐
- 通过命令行创建Django项目
只有安装的是pycharm专业版才可以直接在pycharm面板中直接创建Django项目 如果不是专业版,可以通过命令行创建Django项目 https://www.cnblogs.com/jiare ...
- Nginx笔记总结四:Nginx连接PHP5.4
location ~ .*\.(php)?${ expires -ls; try_file $uri=404; fastcgi_split_path_info ~(.+\.php)(/.+)$; in ...
- 关于前端使用JavaScript获取base64图片大小的方法
base64原理 Base64编码要求把3个8位字节(38=24)转化为4个6位的字节(46=24),之后在6位的前面补两个0,形成8位一个字节的形式. 如果剩下的字符不足3个字节,则用0填充,输出字 ...
- Spring中@Resorce和@Autowired的区别
@Resource的作用相当于@Autowired,只不过@Autowired按byType自动注入,而@Resource默认按 byName自动注入罢了.@Resource有两个属性是比较重要的,分 ...
- 吴裕雄--天生自然python编程:实例(1)
str = "www.runoob.com" print(str.upper()) # 把所有字符中的小写字母转换成大写字母 print(str.lower()) # 把所有字符中 ...
- 2016年3月13日 FXStreet首席分析师:欧元/美元下周走势展望
FX168讯 欧元/美元在经历周初沉闷的走势之后,最终在欧洲央行出台一系列措施促进通货膨胀和经济增长之后怒涨至近一个月最高位.欧洲央行决议公布之前,投资者预期存款利率将下调10至15个基点,并可能进一 ...
- Shell的特殊字符
# 有意义的“#”符合 echo ${PATH#*:} # 参数替换,不是一个注释 echo $(( 2#101011 )) # 进制转换,可以是任意进制,不是一个注释 “.” .字符匹配,这是作为正 ...
- classnames
在React中编写模板时给标签添加class. 如果是固定的className="XX"就可以了. 如果要根据状态值动态应用或去除, 或使用多个class时就麻烦了. 可以使用cl ...
- html|Area
http://tomys.win/ HTML图片热区Area map的用法只是在上学的时候学习到过,在实际工作中一直没用过,如果 不是这次紧急任务,可能永远都不会想起这个功能.在一些特殊的html ...
- SYC极客大挑战部分题目writeup
Welcome 复制黏贴flag即可 我相信你正在与我相遇的路上马不停蹄 关注微信工作号回复"我要flag"即可获得flag 代号为geek的行动第一幕:毒雾初现 发现flag为摩 ...