topN问题

topN问题：给出一个数组，找出前N个最大的元素。

topN问题可以用分治法解决，这个问题与快速排序类似，快速排序是用一个数对数组进行划分，topN问题则不需完成排序，只需划分出前n个最大的数字即可。所以可以采用快排中partition函数的操作，将每次操作的返回值与N作对比，若比N小则对N及其后续的元素继续进行划分，若比N大则对N及其之前的元素进行划分，直到找出N。

该方法的时间复杂度：Θ(n)

示例代码：

import random

def partition(a,i,j):

    if i < j:

        key = random.randint(i,j)

        tmp = a[key]

        a[key] = a[j]

        a[j] = tmp

        k = i-1

        for index in range(i,j):

            if a[index] > a[j]:

                k += 1

                tmp = a[k]

                a[k] = a[index]

                a[index] = tmp

        else:

            k += 1

            tmp = a[k]

            a[k] = a[j]

            a[j] = tmp

            #此处与快排不同，当欲划分的数组元素皆相同时会导致栈溢出，所以当元素相同时

            #返回一个随机下标

            if a[i] == a[j]:

                return random.randint(i,j)

        return k

    return i

def find_top_n(a,i,j,top_index):

    top_ret = partition(a,i,j)

    #当返回值比top_index小时，对top_ret及后续元素继续进行划分

    if top_ret < top_index:

        return find_top_n(a,top_ret,j,top_index)

    #当返回值比top_index大时，对top_ret及先前元素继续进行划分

    elif top_ret > top_index:

        return find_top_n(a,i,top_ret,top_index)

    #当返回值等于top_index时，已找到TopN

    else:

        return top_ret

def main(args):

    a = []

    for i in range(10):

        a.append(random.randint(0,100))

    print(a)

    find_top_n(a,0,len(a)-1,5)

    print(a)

    return 0

if __name__ == '__main__':

    import sys

    sys.exit(main(sys.argv))

topN问题的更多相关文章

storm入门（二）：关于storm中某一段时间内topN的计算入门
刚刚接触storm 对于滑动窗口的topN复杂模型有一些不理解,通过阅读其他的博客发现有两篇关于topN的非滑动窗口的介绍.然后转载过来. 下面是第一种: Storm的另一种常见模式是对流式数据进行所 ...
【mysql】一维数据TopN的趋势图
创建数据表语句数据表数据对上述数据进行TopN排名 select severity,sum(count) as sum from widgt_23 where insertTstamp>=' ...
【转载】使用LFM（Latent factor model）隐语义模型进行Top-N推荐
最近在拜读项亮博士的<推荐系统实践>,系统的学习一下推荐系统的相关知识.今天学习了其中的隐语义模型在Top-N推荐中的应用,在此做一个总结. 隐语义模型LFM和LSI,LDA,Topic ...
QL查询案例：取得分组 TOP-N
[转]SQL查询案例:取得分组 TOP-N CREATE TABLE TopnTest ( name VARCHAR(10), --姓名 procDate DATETIME, ...
使用LFM（Latent factor model）隐语义模型进行Top-N推荐
最近在拜读项亮博士的<推荐系统实践>,系统的学习一下推荐系统的相关知识.今天学习了其中的隐语义模型在Top-N推荐中的应用,在此做一个总结. 隐语义模型LFM和LSI,LDA,Topic ...
大数据算法设计模式(1) - topN spark实现
topN算法,spark实现 package com.kangaroo.studio.algorithms.topn; import org.apache.spark.api.java.JavaPai ...
topN 算法以及逆算法（随笔）
topN 算法以及逆算法(随笔) 注解:所谓的 topN 算法指的是在海量的数据中进行排序从而活动前 N 的数据. 这就是所谓的 topN 算法.当然你可以说我就 sort 一下排序完了直 ...
pyspark进行词频统计并返回topN
Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator imp ...
TOP-N类查询
Top-N查询 --Practices_29:Write a query to display the top three earners in the EMPLOYEES table. Displa ...
hive 分组排序，topN
hive 分组排序,topN 语法格式:row_number() OVER (partition by COL1 order by COL2 desc ) rankpartition by:类似hiv ...

随机推荐

Office Diary(工作日记本)
Office Diary 是一款免费.绿色小巧的写日记和收集文档资料的软件,界面效仿Office Word ,支持Word中常用的文字编辑排版功能,可以作为Microsoft Office产品系列的强 ...
Android Studio无法找到tool.jar解决方法！
今天安装并配置了JDK,可以在DOS窗口中使用“java -version”命令查看JAVA版本信息了,随后安装Android Studio,但是等Android Studio安装完毕,启动时候发现, ...
关联关系的接口+unittest实现关联接口
关联关系的接口: import requests def login(): url = 'http://ip/api/user/login' data = {'username':'niuhang', ...
JVM高级特性与实践（一）：Java内存区域与内存溢出异常
套用<围城>中的一句话,“墙外面的人想进去,墙里面的人想出来”,用此来形容Java与C++之间这堵内存动态分配和垃圾收集技术所围成的“围墙”就再合适不过了. 对于从事C.C++的开发人员而 ...
vue可视化图表基于Echarts封装好的v-charts简介
**vue可视化图表基于Echarts封装好的v-charts** 近期公司又一个新的需求,要做一个订单和销售额统计的项目,需要用到可视化图表来更直观的展示数据.首先我想到的是Echarts,众所周 ...
设置placeholder的样式
:-moz-placeholder { /* Mozilla Firefox 4 to 18 */ color: #f00; } ::-moz-placeholder { /* Mozilla Fir ...
SDUT OJ 效率至上（线段树）
效率至上 Time Limit: 5000 ms Memory Limit: 65536 KiB Submit Statistic Problem Description 题意很简单,给出一个数目为n ...
SDUT OJ 数据结构实验之排序二：交换排序
数据结构实验之排序二:交换排序 Time Limit: 1000 ms Memory Limit: 65536 KiB Submit Statistic Discuss Problem Descrip ...
百度地图中使用mouseover事件获取经纬度时无法拿到鼠标所在位置的经纬度。
用百度2.0的话使用mousemove 鼠标在地图区域移动过程中触发此事件.mouseover参数e中没有point参数
MacOs桌面自动被打乱的原因
1 系统设置--Mission Control -- 自动根据最近使用情况排序的勾勾去掉

topN问题

topN问题的更多相关文章

随机推荐

热门专题