TopK (MinK) 实现

概述：基于快排原理找到最小的K个元素，属于Top K问题。注意，使用快排原理找前K小问题不需要对整个数组进行O(nlogn)的排序。我们只要找K所在的区间进行递归调用，即每次只要对数据的一半进行递归调用，而不用对全部的数据进行递归调用，从而降低了时间复杂度。平均情况下，时间复杂度计算：n + n/2 + ... + n/n = 2n, 因此时间复杂度是O(n)。

 import java.util.Arrays;

 public class MinK {

     public static void main(String[] args) {

         int[] arr = {3,45,78,64,52,64,64,55,55,11,2};

         System.out.println(arrayToString(arr,"Array:"));

         int k = 3;

         int[] res = quickSearch(arr, 0, arr.length-1, k);

         System.out.println(arrayToString(res,"MinK :"));

     }

     /**

      * 基于快排找到最小的K个元素

      * nums   数组

      * left  数组左下标

      * right 数组右下标

      * k     k值

      */

     private static int[] quickSearch(int[] nums, int left, int right, int k) {

         // 每快排切分1次，找到排序后下标为j的元素，如果j恰好等于k就返回j以及j左边所有的数；

         int j = partition(nums, left, right);

         if (j == k) {

             return Arrays.copyOf(nums, j);

         }

         else if (j < k) {

             return quickSearch(nums,j+1, right, k);

         }

         else{

             return quickSearch(nums, left, j-1, k);

         }

     }

     // 快排切分，返回下标j，使得比numss[j]小的数都在j的左边，比numss[j]大的数都在j的右边。

     private static int partition(int[] nums, int left, int right) {

         int key = nums[left];

         int i = left;

         int j = right;

         while(i<j){   //当i=j时退出总循环

             while(nums[j] >= key && i < j) j--;  //从右往左，找到比key小的值方可退出循环

             while(nums[i] <= key && i < j) i++;  //从左往右，找到比key大的值方可退出循环

             if(i<j){

                 int temp = nums[i];  // 把左边大的值与右边小的值进行交换

                 nums[i] = nums[j];

                 nums[j] = temp;

             }

         }

         nums[left] = nums[i];

         nums[i] = key;   //把key交换到中间

         return i;

     }

     private static String arrayToString(int[] arr,String flag) {

         String str = flag+'\t';

         for(int a : arr) {

             str += a + "\t";

         }

         return str;

     }

 }

结果：

TopK (MinK) 实现的更多相关文章

[数据结构]——堆（Heap）、堆排序和TopK
堆(heap),是一种特殊的数据结构.之所以特殊,因为堆的形象化是一个棵完全二叉树,并且满足任意节点始终不大于(或者不小于)左右子节点(有别于二叉搜索树Binary Search Tree).其中,前 ...
关于堆排序和topK算法的PHP实现
问题描述 topK算法,简而言之,就是求n个数据里的前m大个数据,一般而言,m<<n,也就是说,n可能有几千万,而m只是10或者20这样的两位数. 思路最简单的思路,当然是使用要先对这n ...
MapReduce实现TopK的示例
由于开始学习MapReduce编程已经有一段时间了,作为一个从编程中寻找自信和乐趣以及热爱编程的孩子来讲,手开始变得很“痒”了,很想小试一下身手.于是自己编写了TopK的代码.TopK的意思就是从原文 ...
InAction-MR的topK
本来只是想拿搜狗的数据练练手的,却无意踏足MR的topK问题.经过几番波折,虽然现在看起来很简单,但是摸爬滚打中也学到了不少数据是搜狗实验室下的搜索日志,格式大概为: 00:00:00 298219 ...
MapReduce TopK统计加排序
Hadoop技术内幕中指出Top K算法有两步,一是统计词频,二是找出词频最高的前K个词.在网上找了很多MapReduce的Top K案例,这些案例都只有排序功能,所以自己写了个案例. 这个案例分两个 ...
[151225] Python3 实现最大堆、堆排序，解决TopK问题
参考资料: 1.算法导论,第6章,堆排序堆排序学习笔记及堆排序算法的python实现 - 51CTO博客堆排序 Heap Sort - cnblogs 小根堆实现优先队列:Python实现 -cn ...
Topk引发的一些简单的思考
软件工程课程的一个题目:写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来.文本文件大约是30KB~300KB大小. 首先说一下这边的具体的实现都是在linux上实现的. ...
hadoop记录topk
lk@lk-virtual-machine:~$ cd hadoop-1.0.1 lk@lk-virtual-machine:~/hadoop-1.0.1$ ./bin dfs -mkdir inpu ...
Python使用heapq实现小顶堆（TopK大）、大顶堆（BtmK小）
Python使用heapq实现小顶堆(TopK大).大顶堆(BtmK小) | 四号程序员 Python使用heapq实现小顶堆(TopK大).大顶堆(BtmK小) 4 Replies 需1求:给出N长 ...

随机推荐

使用PHP-Beast加密你的PHP源代码
PHP-Beast是一个PHP源码加密的模块,其使用DES算法加密,用户可以自定义加密的key来加密源代码. 1. PHP-Beast的安装 $ wget https://github.com/lie ...
图论--Dijkstra算法总结
Key word: ①BFS转换Dijkstra ②其他关系转化为最短路 ③反向建边及反向Dijkstra ④稠密图.稀疏图 ⑤链式前向星 ⑥Vector建图 ⑦超级源点&汇点详解: 1.B ...
web安全笔记
判断网站是否伪静态把.html后缀即可或者加.php?id=99 例子:33_99.html 去掉.html和_变成33.php?id=99 即可判断是否伪静态判断网站是否在win或者linu ...
在html中使用vue组件
最近在维护公司的项目,当我拿到项目时,发现他用了vue. 但是~~仅仅是引用vue.js文件,整体的架构还是html那种,没有用webpack! 当时觉得~哇~原来还可以这样! 然后了解了业务逻辑和代 ...
search（10）- elastic4s-multi_match：多字段全文搜索
在全文搜索中我们常常会在多个字段中匹配同一个查询条件或者在不同的字段中匹配不同的条件.比如下面这个例子: GET /books/_search { "query": { " ...
LeetCode--LinkedList--141.Linked List Cycle（Easy）
141. Linked List Cycle(Easy)2019.7.10 题目地址https://leetcode.com/problems/linked-list-cycle/ Given a l ...
DotNet：Socket Server 异步套接字服务端实现
异步服务器套接字示例 From https://msdn.microsoft.com/zh-cn/library/fx6588te(v=vs.110).aspx 下面的示例程序创建接收来自客户端的连接 ...
JS实现手机号码中间4位变星号
这个问题,我们可以用截取字符串解决,以下我列出2种方法,小伙伴们可以根据自己的需要选择哦: ● 1,substring()方法用于提取字符串中介于两个指定下标之间的字符. '; //该号码是乱打出来的 ...
MOS管、PCB、H桥、步进电机驱动电路、51单片机的IO口驱动能力、灌电流、拉电流、上拉电阻的选择
嵌入式开发PCB设计几点体会(转载):http://bbs.ednchina.com/BLOG_ARTICLE_3021801.HTMCollector-Emitter Saturation Volt ...
解决：idea中右键项目找不到subversion
2019.02版IDEA,刚刚发现更新不了项目,但是我记得之前的项目是可以直接更新的.然后,我打开之前的项目找到相关项,对比了一下,找到了方法: file--settings--Version Con ...

TopK (MinK) 实现

TopK (MinK) 实现的更多相关文章

随机推荐

热门专题