将题目具体一点,例如,从100个数中取出从大到小排前10的数

方法1:使用快速排序

因为快速排序一趟下来,小于K的数都在K的前面,大于K的数都在K的后面

如果,小于K的数有35个,大于K的数有64个

那么,所以我们取top 10时,只需要在前35个数中进行递归快速排序,所以不需要对所有的数进行排序

方法2:使用堆排序

首先在前10个数中建议一个小根堆,

因为是小根堆,所以前10个数中最小的数在index=0上

然后遍历从11到100的数,如果p[i]>p[0],那么交换p[i]和p[0],然后重建堆

遍历完成后,top 10的数就是堆中

我用10万个随机数做实验,性能分析如下:

表示当选取top 10时,快速排序花费3833微秒,堆排序花费642微秒

结论:

取top n时,当n小时,堆排序比快速排序有明显的优势,当n增加时,优势减少,甚至逆转

以下是实验代码,仅供参考

void adjust_min_heap(int*p, int index,int max)
{
        int target,left=2*index+1,right=left+1;
        if(right <= max)
        {
                //左右孩子都存在,找相对较小的
                if( p[left]

target=left;
                else
                        target=right;
        }
        else if(left==max)
        {
                //只有左孩子存在
                target=left;
        }
        else
        {
                return;
        }
        if(p[target]

{
                exchange(&p[target],&p[index]);
                adjust_min_heap(p,target,max);
        }
}

void find_top_n_min_heap(int*p, int num, int *n)
{
        //如果总的个数还不够
        if(num<=*n)
        {
                *n=num;
                return;
        }

int i;
        //将前n个数调整为小根堆
        for(i=*n/2-1;i>=0;i--)
                adjust_min_heap(p,i,*n-1);

int j;
        for(j=*n;j
                if(p[j]>p[0])
                {
                        exchange(&p[j],&p[0]);
                        adjust_min_heap(p,0,*n-1);
                }
}

void find_top_n_1(int*p, int begin, int end, int n)
{
        if(begin>=end)return;
        int i = begin+1,j=end;
        while(i
        {
                while(i=p[begin])i++;
                while(j>begin && p[j]<=p[begin])j--;
                if(i
                {
                        exchange(&p[i],&p[j]);
                }
        }
        if(p[begin]

exchange(&p[begin],&p[j]);
        if(end-begin==1 && n==1)
        {
                printf("%d\n",p[begin]);
                return;
        }
        if(j-begin+1 > n)
                find_top_n_1(p,begin,j,n);
        else if(j-begin+1 == n)
        {
                int k;
                for(k=begin;k<=j;k++)
                        printf("%d\n",p[k]);
        }
        else if(j-begin+1 < n)
        {

int k;
                for(k=begin;k<=j;k++)
                        printf("%d\n",p[k]);
                find_top_n_1(p,j+1,end,n-j+begin-1);
        }
}
void find_top_n_quick_sort(int*p, int num, int n)
{
        find_top_n_1(p,0,num-1,n);
}

从m个数中取top n的更多相关文章

  1. 【算法与数据结构】在n个数中取第k大的数(基础篇)

    (转载请注明出处:http://blog.csdn.net/buptgshengod) 题目介绍            在n个数中取第k大的数(基础篇),之所以叫基础篇是因为还有很多更高级的算法,这些 ...

  2. 海量数据处理 - 10亿个数中找出最大的10000个数(top K问题)

    前两天面试3面学长问我的这个问题(想说TEG的3个面试学长都是好和蔼,希望能完成最后一面,各方面原因造成我无比想去鹅场的心已经按捺不住了),这个问题还是建立最小堆比较好一些. 先拿10000个数建堆, ...

  3. 找出n个自然数(1,2,3,……,n)中取r个数的组合

    <?php /** * 对于$n和$r比较小, 可以用这种方法(当n=5, r=3时) */ function permutation1($n, $r) { for($i=1; $i<=$ ...

  4. hdu 5265 技巧题 O(nlogn)求n个数中两数相加取模的最大值

    pog loves szh II Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) ...

  5. 算法题解:最大或最小的K个数(海量数据Top K问题)

    题目 输入 n 个整数,找出其中最小的 k 个数.例如输入4.5.1.6.2.7.3.8 这8个数字,则最小的4个数字是1.2.3.4. 初窥 这道题最简单的思路莫过于把输入的 n 个整数排序,排序之 ...

  6. 算法题解:最小的K个数(海量数据Top K问题)

    [本文版权归微信公众号"代码艺术"(ID:onblog)所有,若是转载请务必保留本段原创声明,违者必究.若是文章有不足之处,欢迎关注微信公众号私信与我进行交流!] 题目 输入 n ...

  7. sql 分组取最新的数据sqlserver巧用row_number和partition by分组取top数据

    SQL Server 2005后之后,引入了row_number()函数,row_number()函数的分组排序功能使这种操作变得非常简单 分组取TOP数据是T-SQL中的常用查询, 如学生信息管理系 ...

  8. Oracle:分割字符串 取TOP N条记录

    oracle数据库,表数据如下: ids                           id 3,4,5                        7 13,14,15,16         ...

  9. row_number和partition by分组取top数据

    分组取TOP数据是T-SQL中的常用查询, 如学生信息管理系统中取出每个学科前3名的学生.这种查询在SQL Server 2005之前,写起来很繁琐,需要用到临时表关联查询才能取到.SQL Serve ...

随机推荐

  1. SQL数据库的备份和恢复

    SQL数据库的备份和恢复 一.SQL数据库的备份: 1.依次打开 开始菜单 → 程序 → Microsoft SQL Server 2008 → SQL Server Management Studi ...

  2. Javascript实现图片库效果

    思路: 无序列表加载图片文件.用img标签加载一张图片作为占位符.当点击照片链接时,改变<a>元素的href属性.并且阻止浏览器的默认行为. 动态改变描述文字,在图片下方增加P标签.通过获 ...

  3. 数据库(学习整理)----5--Oracle常用的组函数

    其他: 1.oracle中下标是从1开始的,Java下标是从0开始的 函数分类: 日期函数 字符函数 转换函数 数学函数 系统函数 ---在当前月份上面:增加.减少月份 select add_mont ...

  4. 169. Majority Element(C++)

    169. Majority Element Given an array of size n, find the majority element. The majority element is t ...

  5. windows注册表的基本使用——示例

    上网找好多资料发现一个问题就是太老.例如只有RegCreateKey而没有RegCreateKeyEx用法详解,自己摸索了几个小时终于基本用到的几个函数都试用了一遍. 下面代码已经通过编译测试 // ...

  6. 利用CART算法建立分类回归树

    常见的一种决策树算法是ID3,ID3的做法是每次选择当前最佳的特征来分割数据,并按照该特征所有可能取值来切分,也就是说,如果一个特征有四种取值,那么数据将被切分成4份,一旦按某特征切分后,该特征在之后 ...

  7. redis数据类型(字符串)

    字符串 这是最简单Redis类型.如果你只用这种类型,Redis就像一个可以持久化的memcached服务器 127.0.0.1:6379> set mykey somevalue OK 127 ...

  8. Struts面试笔记

    Struts2面试题1.struts2工作流程Struts 2框架本身大致可以分为3个部分:核心控制器FilterDispatcher.业务控制器Action和用户实现的企业业务逻辑组件. 核心控制器 ...

  9. mount 挂载光盘

    mount作用 挂载光盘镜像文件.移动硬盘.U盘以及Windows网络共享和UNIX NFS网络共享 mount [-t vfstype] [-o options] device dir mount ...

  10. nginx服务器,php-fpm重启

    1.重启nginx服务器:首先whereis nginx找到你的nginx命令执行文件所在目录,直接/usr/local/nginx/sbin/nginx -s reload 这个路径可能每个人不一样 ...