算法思想

01 n个数据需要排序，就把数据映射到 [0, n-1] ，然后用 int 数组 id2num [n] 完成 “编号 to 出现次数的映射 ”；

　　简单来说，对于正整数数据，先找到最大值maxData，那么可以直接创建 int data2num [ maxData+1 ]的数组，这样 data2num[i] 就是数据 i 的出现次数。

　　映射和统计出现次数都只需要遍历一遍，时间复杂度均为 O(n)。

02 因为已经完成了data2num的映射，索引是数据，且索引int值的大小顺序与数据的大小顺序一致，所以直接输出即可完成排序；

　　例如原始数据为[1,3,9, 5,7,9]，则data2num数组中索引为[1,3,5,7]的值都是1，data2num[9] = 2，索引为剩下的[0,2,4,6,8]的值都是0；

　　递增排序结果：

　　　　我们直接顺序遍历data2num数组，对每个值data2num[i]，输出data2num[i]个 i 即可。样例的输出就是：[1,3,5,7,9,9]

　　递减排序结果：

　　　　我们直接逆序遍历data2num数组，做同样的操作。样例的输出就是：[9,9,7,5,3,1]

03 显而易见，这种算法适合处理重复值很多的序列，那么它的最佳应用就是求Top N热词。

　　因为Top N热词就是出现次数最多的前N个词，那么我们只需要建立num2string的链表数组即可；

　　这样，num2string[i] 就表示存储了所有出现 i 次的热词string的链表，逆序输出 N 个词就完成了这个任务。

C++代码

#include<iostream>

#include<vector>

#include<unordered_map>

using namespace std;

// 计数排序，通过记录所有元素出现的次数来实现O(n)的排序算法

// 以最简单的正整数数据为例：

vector<int> JiShuSort(vector<int>&a, bool asc=true) {

    int n = a.size(), maxData = 0;

    //找到最大元素（每个元素都是正整数）

    for (int i = 0; i < n; i++) {

        maxData = max(maxData, a[i]);

    }

    // 数据都是正整数，最多有从1到maxData共maxData种数据，所以空间只用开辟这么大

    vector<int>data2num(maxData + 1, 0);

    // 记录所有数据出现的次数，进行从maxData种数据到出现次数num的映射 data to num

    for (int i = 0; i < n; i++) {

        data2num[a[i]]++;

    }

    // 获得排序结果

    vector<int> ans;

    if (asc) {      //递增顺序就从前向后遍历

        for (int i = 1; i <= maxData; i++) {

            for (int j = 0; j < data2num[i]; j++) {

                ans.push_back(i);

            }

        }

    }

    else {          //递减顺序就从后向前遍历

        for (int i = maxData; i > 0; i--) {

            for (int j = 0; j < data2num[i]; j++) {

                ans.push_back(i);

            }

        }

    }

    return ans;

}

// 打印n个字符串中出现次数最多的前N个字符串，TOP N 热词算法

// n个字符串共有cnt种不同的字符串

// 时间复杂度O(3*n + 2*cnt + N) = O(n)

void PrintTopN(vector<string>& a, int N) {

    cout << "-----------the Top " << N << " hot words is belowe--------------\n";

    unordered_map<string, int> string2id;  //hash表对新key值的默认value值为0

    int n = a.size(), cnt = 0;

    // 对cnt个不同的字符串进行hash映射，映射到[1,cnt]

    for (int i = 0; i < n; i++) {

        if (string2id[a[i]] == 0)string2id[a[i]] = ++cnt;

    }

    // 进行id到string的反向映射

    vector<string>id2string(cnt + 1);

    for (int i = 0; i < n; i++) {

        id2string[string2id[a[i]]] = a[i];

    }

    // 记录cnt个字符串出现的次数，第i个字符串出现num[i-1]次

    vector<int>id2num(cnt + 1);

    for (int i = 0; i < n; i++) {

        id2num[string2id[a[i]]]++;

    }

    // 找到最大出现次数

    int maxNum = 0;

    for (int i = 1; i <= cnt; i++)

        maxNum = max(maxNum, id2num[i]);

    // 记录每个出现次数对应的字符串id

    vector<vector<int>>num2id(maxNum + 1, vector<int>());

    for (int i = 1; i <= cnt; i++) {

        num2id[id2num[i]].push_back(i);

    }

    // 逆序打印top N

    for (int i = maxNum; i > 0; i--) {

        for (int x : num2id[i]) {

            if (N-- == 0)return;

            cout << id2string[x] << '\n';

        }

    }

}

int main() {

    string a[11] = { "one","two","three","four","five","six","steven","eight","nine","ten","eleven" };

    vector<string> strData;

    vector<int> intData;

    // 让strData中是1个“one”，2个“two”，...， 11个“eleven”

    // 让intData中是1个1，2个2，...，11个11

    for (int i = 0; i < 11; i++) {

        for (int j = 0; j <= i; j++) {

            strData.push_back(a[i]);

            intData.push_back(i + 1);

        }

    }

    // 获得intData的递减排序结果

    vector<int> ans = JiShuSort(intData, false);

    cout << "---------------下面是intData递减排序后的数据---------------\n";

    for (int x:ans) {

        cout << x << '\n';

    }

    // 获得intData的递增排序结果，asc默认是true

    ans = JiShuSort(intData);

    cout << "---------------下面是intData递增排序后的数据---------------\n";

    for (int x : ans) {

        cout << x << '\n';

    }

    //打印strData中的top 10 热词

    PrintTopN(strData, 10);

    return 0;

}

一种O(n)时间复杂度的计数排序算法和Top N热词算法的更多相关文章

js中各个排序算法和sort函数的比较
js中要实现数据排序,其实只需要用sort函数就能很好的满足了,但是我今天想知道他和其他排序算法的区别,比如耗时呀等.测了一组数据如下: // ---------- 一些排序算法 Sort = {} ...
惊！世界上竟然有O(N)时间复杂度的排序算法！计数排序！
啥?你以为排序算法的时间复杂度最快也只能O(N*log(N))了? O(N)时间复杂度的排序算法听说过没有?计数排序!!它是世界上最快最简单的算法!!! 计数排序算法操作起来只有三步,看完秒懂! 根据 ...
计数排序算法——时间复杂度O（n+k）
计数排序计数排序是一个非基于比较的排序算法,该算法于1954年由 Harold H. Seward 提出.它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),快于 ...
计数排序和桶排序（Java实现）
目录比较和非比较的区别计数排序计数排序适用数据范围过程分析桶排序网络流传桶排序算法勘误桶排序适用数据范围过程分析比较和非比较的区别常见的快速排序.归并排序.堆排序.冒泡排序等属于比 ...
计数排序 + 线段树优化 --- Codeforces 558E : A Simple Task
E. A Simple Task Problem's Link: http://codeforces.com/problemset/problem/558/E Mean: 给定一个字符串,有q次操作, ...
归并排序 & 计数排序 & 基数排序 & 冒泡排序 & 选择排序 ----> 内部排序性能比较
2.3 归并排序接口定义: int merge(void* data, int esize, int lpos, int dpos, int rpos, int (*compare)(const v ...
计数排序详解以及java实现
前言我们知道,通过比较两个数大小来进行排序的算法(比如插入排序,合并排序,以及上文提到的快速排序等)的时间复杂度至少是Θ(nlgn),这是因为比较排序对应的决策树的高度至少是Θ(nlgn),所以排序 ...
计数排序(C语言版本)
让我们来谈谈数的排序思维: 计数排序假定待排序的全部元素都是介于0到K之间的整数.计数排序使用一个额外的数组countArray.当中第i个元素是待排序数组array中值等于i的元素的个数.然后依据数 ...
排序算法的C语言实现(下线性时间排序：计数排序与基数排序)
计数排序计数排序是一种高效的线性排序. 它通过计算一个集合中元素出现的次数来确定集合如何排序.不同于插入排序.快速排序等基于元素比较的排序,计数排序是不需要进行元素比较的,而且它的运行效率要比效率为 ...

随机推荐

TetBrains产品快捷键大全
快捷键大全
LCT板子
粘板子: #include<cstdio> #include<cstring> #include<algorithm> using namespace std; c ...
三分钟掌控Actor模型和CSP模型
回顾一下前文<三分钟掌握共享内存模型和 Actor模型> Actor vs CSP模型传统多线程的的共享内存(ShareMemory)模型使用lock,condition等同步原语来强行 ...
教你识别一些sequence的相关问题
摘要:通过一些自定义的视图或者查询语句,批量识别集群的sequence相关问题本文分享自华为云社区<GaussDB(DWS)运维 -- sequence常见运维操作>,作者: 譡里个檔. ...
kvm管理查看信息，添加，删除，暂停恢复，克隆等
KVM virsh管理指令 virsh 查看帮助信息查看命令帮助 [root@KVM ~]# virsh Welcome to virsh, the virtualization interacti ...
RocketMQ下载安装
windows下RocketMQ下载安装教程一.下载 1.官网下载:http://rocketmq.apache.org/dowloading/releases/ 2.百度网盘下载:https: ...
LCS&&LRC&&LIS问题
注:最近笔试题经常碰到DP动态规划的问题,但是由于本人没有接触过DP,笔试后看到别人家的答案简洁又漂亮,真的羡慕:难的DP自己可能不会,那再见到常见的LCS和LRS以及LIS为问题总该会吧: 资料参考 ...
【Java面试宝典】说说你对 Spring 的理解，非单例注入的原理？它的生命周期？循环注入的原理， aop 的实现原理，说说 aop 中的几个术语，它们是怎么相互工作的？
AOP与IOC的概念(即spring的核心) IOC:Spring是开源框架,使用框架可以使我们减少工作量,提高工作效率并且它是分层结构,即相对应的层处理对应的业务逻辑,减少代码的耦合度.而sprin ...
Configuration problem: 'bean' or 'parent' is required for <ref> element
我出现此错误的原因是web.xml中没有指定spring的启动配置文件applicationContext.xml的加载位置.applicationContext.xml原来再webRoot/webI ...
怎么样把ModelMap里面的数据放入Session里面？
答:可以在类上面加上@SessionAttributes注解,里面包含的字符串就是要放入session里面的key.

一种O(n)时间复杂度的计数排序算法和Top N热词算法

算法思想

C++代码

一种O(n)时间复杂度的计数排序算法和Top N热词算法的更多相关文章

随机推荐

热门专题