求数组前K个大的数

我们举例，假若从10000万个数里选出前100个最大的数据。

首先我们先分析：既然要选出前100个最大的数据，我们就建立一个大小为100的堆（建堆时就按找最大堆的规则建立，即每一个根节点都大于它的子女节点），然后再将后面的剩余数据若符合要求就插入堆中，不符合就直接丢弃该数据。

那我们现在考虑：确定是该选择最大堆的数据结构还是最小堆的数据结构呢。

分析一下：

若选用最大堆的话，堆顶是堆的最大值，我们考虑既然要选出从10000万个数里选出前100个最大的数据，我们在建堆的时候，已经考虑了最大堆的特性，那这样的话最大的数据必然在它顶端。假若真不巧，我开始的前100个数据中已经有这10000个数据中的最大值了，那对于我后面剩余的10000-100的元素再想入堆是不是入不进去了！！！所以，选用最大堆从10000万个数里选出前100个最大的数据只能找出一个，而不是100个。

那如果选用最小堆的数据结构来解决，最顶端是最小值，再次遇到比它大的值，就可以入堆，入堆后重新调整堆，将小的值pass掉。这样我们就可以选出最大的前K个数据了。言外之意，假若我们要找出N个数据中最小的前k个数据，就要用最大堆了。

#define _CRT_SECURE_NO_WARNINGS 1

#include<iostream>

using namespace std;

#include<assert.h>

void AdjustDown(int* a, int parent, int size)

{

    int child = 2 * parent + 1;

    while (child < size)

    {

        if (child + 1 < size && a[child] > a[child + 1])

        {

            child++;

        }

        if (a[parent]>a[child])

        {

            swap(a[parent], a[child]);

            parent = child;

            child = 2 * parent + 1;

        }

        else

        {

            break;

        }

    }

}

void Print(int* a, int size)

{

    cout << "前k个最大的数据：" << endl;

    for (int i = 0; i < size; i++)

    {

        cout << a[i] << "  ";

    }

    cout << endl;

}

int* HeapSet(int*a,int N,int K)

{

    assert(a);

    assert(K > 0);

    int* arr = new int[K];

    //将前K个数据保存

    for (int i = 0; i < K; i++)

    {

        arr[i] = a[i];

    }

    //建堆

    for (int i = (K-2)/2; i >=0; i--)

    {

        AdjustDown(arr,i,K);

    } 

    //对剩余的N-K个元素比较大小

    for (int i = K; i < N; i++)

    {

        if (arr[0]<a[i])

        {

            arr[0] = a[i];

            AdjustDown(arr, 0, K);

        }

    }

    return arr;

    delete[] arr;

}

void Test()

{

    int arr[] = { 12, 2, 10, 4, 6, 8, 54, 67, 25, 178 };

    int k = 5;

    int* ret = HeapSet(arr, sizeof(arr) / sizeof(arr[0]), k);

    Print(ret, k); 

}

int main()

{

    Test();

    system("pause");

    return 0;

}

由此可以看出，时间复杂度为：Ｋ＋（Ｋ-2）/２*lgn＋（Ｎ－Ｋ）*lgn --＞ O(N)

空间复杂度为：K-->O(1)。

求数组前K个大的数的更多相关文章

MATLAB寻找数组前k个大值
有时候我们需要寻找数组的前k个大值并按照顺序输出, 在C语言可以通过快速排序等算法,快速求得,这里用matlab写了一个比较简单实用的程序(适用于数组长度不是特别大的情况). function [va ...
[csu/coj 1080]划分树求区间前k大数和
题意:从某个区间内最多选择k个数,使得和最大思路:首先题目给定的数有负数,如果区间前k大出现负数,那么负数不选和更大,于是对于所有最优选择,负数不会出现,所以用0取代负数,问题便转化为区间的前k大数 ...
无序数组中第Kth大的数
题目:找出无序数组中第Kth大的数,如{63,45,33,21},第2大的数45. 输入: 第一行输入无序数组,第二行输入K值. 该是内推滴滴打车时(2017.8.26)的第二题,也是<剑指of ...
输出数组里面第N大的数
好像有些大公司出过面试题:找出数组里面第N大的数,当然有点变化,但本质部分是这样的. 要求是不能排序,时间复杂度不能超过O(n^2) 思路很多,我暂时就只会快排衍生的那种.如果对快速排序不太熟悉了,建 ...
快速排序及查找第K个大的数。
本文提供了一种基于分治法思想的,查找第K个大的数,可以使得时间复杂地低于nlogn. 因为快排的平均时间复杂度为nlogn,但是快排是全部序列的排序, 本文查找第k大的数,则不必对整个序列进行排序.请 ...
认真对待每一道算法题之两个排序好的数组寻找的第k个大的数
转载博客:http://www.cnblogs.com/buptLizer/archive/2012/03/31/2427579.html 题目意思:给出两个排好序的数组 ,不妨设为a,b都按升序排列 ...
[经典] 在未排序数组中返回topK大的数
解法一,排序先从大到小快排,然后扫前K个返回时间复杂度:O(NlogN),空间复杂度O(1) 解法二,优先队列前K个放入优先队列中,与最小堆顶元素比较大小,若大于则删除堆顶并插入:否则跳过时间 ...
(算法)Partition方法求数组第k大的数
如题,下面直接贴出代码: #include <iostream> using namespace std; int Partition(int* A,int left,int right) ...
【RMQ问题】求数组区间最大值,NYOJ-1185-最大最小值
转自:http://blog.csdn.net/lilongherolilong/article/details/6624390 先挖好坑,明天该去郑轻找虐 RMQ(Range Minimum/Max ...

随机推荐

linux 硬盘满了后，查看使用目录占用空间情况
cd 切换到目录, du -ah --max-depth=1 查看当前目录下的文件夹占用情况
git push时出现 Username for 'https://github.com': 仅仅限于github
使用git push origin master是出现如下问题:Username for 'https://github.com': 解决办法: git remote set-url origin g ...
Leetcode练习题 7. Reverse Integer
7. Reverse Integer 题目描述: Given a 32-bit signed integer, reverse digits of an integer. Example 1: Inp ...
【shell脚本】定时备份日志===logBackup.sh
定时备份日志设置执行权限 [root@VM_0_10_centos shellScript]# chmod a+x logBackup,sh 脚本内容 [root@VM_0_10_centos sh ...
HDU 1723 Distribute Message DP
The contest’s message distribution is a big thing in prepare. Assuming N students stand in a row, fr ...
大咖云集！Kubernetes and Cloud Native Meetup 深圳站开始报名！
由阿里技术生态联合 CNCF 官方共同出品的 Kubernetes & Cloud Native Meetup 将在 8 月 31 日来到深圳.届时,阿里云.蚂蚁金服高级技术专家将携手来自国内 ...
Java8新特性——Optional类的使用(有效的避免空指针异常)
OPtional类的使用概述到目前为止,臭名昭著的空指针异常是导致Java应用程序失败的最常见原因.以前,为了解决空指针异常,Google公司著名的Guava项目引入了Optional类,Guav ...
A Pattern Language for Parallel Programming
The pattern language is organized into four design spaces. Generally one starts at the top in the F ...
spring boot入门，看这篇文章就够了
一.SpringBoot入门 1.基本介绍简化Spring应用开发的一个框架.整个Spring技术栈的一个大整合: J2EE开发的一站式解决方案: 优点: 快速创建独立运行的Spring项目以及与主 ...
jenkins 比较好的学习的文章
来自 : https://www.cnblogs.com/horizonli/tag/jenkins/

求数组前K个大的数

求数组前K个大的数的更多相关文章

随机推荐

热门专题