如何统计序列中元素的频度

问题举例

如何找出随机序列[1, 5, 6, 5, 3, 2, 1, 0, 6, 1, 6]中出现频度最高的3个元素？

如何统计某篇英文文章中词频最高的5个单词？

将序列转换成字典（元素：频度），根据字典的值进行排序

列表

from random import randint

list1 = [randint(0, 10) for _ in range(30)]

print(list1)

dict1 =  dict.fromkeys(list1, 0)

for item in list1:

    dict1[item] += 1

#list comprehensions

dict_res1 = sorted([(v, k) for k, v in dict1.items()], reverse=True)[:3]

print(dict_res1)

#generator comprehensions

dict_res2 = sorted(((v, k) for k, v in dict1.items()), reverse=True)[:3]

print(dict_res2)

分析：使用生成器解析比列表解析节省空间

　　　当一个列表很大时，我们只需要找到出现频度最高的3个元素，如果我们对整个列表都进行排序，

　　　这样显然是很浪费的，一般这种情况我们会使用堆排序

堆排序

from random import randint

import heapq

list1 = [randint(0, 10) for _ in range(30)]

print(list1)

dict1 =  dict.fromkeys(list1, 0)

for item in list1:

    dict1[item] += 1

res = heapq.nlargest(3, ((v, k) for k, v in dict1.items()))

print(res)

使用collections中的Counter对象

from random import randint

from collections import Counter

list1 = [randint(0, 10) for _ in range(30)]

print(list1)

dict1 =  dict.fromkeys(list1, 0)

for item in list1:

    dict1[item] += 1

counter1 = Counter(dict1)

res = counter1.most_common(3)

print(res)

词频统计栗子

import re

from collections import Counter

txt = open('note.txt').read()

word_list = re.split('\W+', txt)

counter1 = Counter(word_list)

res = counter1.most_common(3)

print(res)

参考资料：python3实用编程技巧进阶

python数据结构-如何统计序列中元素的频度的更多相关文章

如何统计序列中元素的频度---Python数据结构与算法相关问题与解决技巧
实际案例: 1. 某随机序列 [12,5,6,4,6,5,5,7]中,找到出现次数最高的3个元素,它们出现的次数是多少? 2. 对于某英文文章的单词,进行词频统计,找到出现次数最高的10个单词,它们出 ...
Python - 如何统计序列中元素出现的频次
1.用内置的count()方法,该方法返回子字符串在字符串中出现的次数(同样适用于列表)2.用collections模块的Counter类示例: from collections import Co ...
python 学习笔记(四) 统计序列中元素出现的频度(即次数)
案例一:在某随机序例中,找到出现频度最高的3个元素,它们出现的次数是多少? from random import randint # 利用列表解析器生成随机序列,包含有30个元素 data = [ra ...
Python中用dict统计列表中元素出现的次数
01 Python增加元素,不像其他语言使用现实的操作接口,只需要dict[1]=3,如果字典中不存在1,则直接新增元素键值对(1,3),如果存在则替换键1为3. if key in dict:判断出 ...
python_如何统计序列中元素
问题1: 随机数列[12,5,8,7,8,9,4,8,5,...] 中出现次数最高的3个元素,他们出现的次数问题2: 对某英文文章的单词,进行词频统计,找出出现次数最搞得10个单词,他们出现的次数是 ...
python基础一 ------如何统计一个列表元素的频度
如何统计一个列表元素的频度两个需求: 1,统计一个随机序列[1,2,3,4,5,6...]中的出现次数前三的元素及其次数 2,统计一片英文文章中出现次数前10 的单词两种方法: 1,普通的for循 ...
1、如何在列表，字典，集合种根据条件筛选数据？2、如何为元组中的每个元素命名，提高程序的可读性3、如何统计出序列中元素出现的频度4、如何根据字典中value的大小，对字典的key进行排序
一.数据筛选: 处理方式: 1.filter函数在py3,返回的是个生成式. from random import randint data = [randint(-100,100) for i in ...
Python 中遍历序列中元素和下标
enumerate 函数用于遍历序列中的元素以及它们的下标 for i,v in enumerate(['tic','tac','toe']): print i,v #0 tic #1 tac #2 ...
python数据结构-如何为元组中的每个元素命名
如何为元组中的每个元素命名简述当对象数据格式固定时,用元组比列表更节省内存空间, 我们使用索引访问元组元素,但是这种访问方式会降低程序的可读性. 举个栗子对于学生的信息,我们有固定的数据格式,我 ...

随机推荐

HMACSHA1 加密算法
https://blog.csdn.net/z69183787/article/details/78393216 ******************************************* ...
case when then 中判断null的方法
--下列SQL无效 SELECT CASE MAX(T.CREATE_TIME) WHEN NULL THEN TO_DATE('2019-03-05 00:00:01','yyyy-MM-dd hh ...
mybatis-plus忽略映射字段
mybatis-plus使用对象属性进行SQL操作,经常会出现对象属性非表字段的情况,忽略映射字段使用以下注解: @TableField(exist = false):表示该属性不为数据库表字段,但又 ...
WebStorm Chinese Language Pack（中文语言包
https://github.com/ewen0930/WebStorm-Chinese http://ewen0930.github.io/2016/04/webstorm-chinese-lang ...
【QT】二进制读取图像文件测试
QDataStream in(&file); int n; in >> n ; file.close(); qDebug() << n<<"en& ...
Rk3288 双屏异显单触摸
系统版本:RK3288 android 5.1 设备同时有两个lcd,主屏是mipi接口,带有触摸屏,触摸屏是usb接口,副屏是hdmi接口,没有触摸屏,正常情况下,两个lcd显示相同内容,触摸屏一切 ...
内存(RAM或ROM)和FLASH存储的真正区别总结
转载自:http://blog.csdn.net/liangkaiyang/article/details/59556531.什么是内存什么是内存呢?在计算机的组成结构中,有一个很重要的部分 ...
3D Slicer Modify Mouse Event 修改3D Slicer中的鼠标响应事件
在3D Slicer中,我们如果想在自己写的插件中来修改默认的鼠标响应事件的话,就需要先将原有的响应事件链接删除,然后建立自定义的响应事件链接,然后将自己要实现的功能写在响应事件函数中. 比如Slic ...
Skip the Class
BestCoder Round #92 Skip the Class Accepts: 678 Submissions: 1285 Time Limit: 2000/1000 MS (Java/ ...
Educational Codeforces Round 4
612A - The Text Splitting 20171121 简单字符串处理题 #include<stdlib.h> #include<stdio.h> #inc ...

python数据结构-如何统计序列中元素的频度

如何统计序列中元素的频度

将序列转换成字典（元素：频度），根据字典的值进行排序

使用collections中的Counter对象

python数据结构-如何统计序列中元素的频度的更多相关文章

随机推荐

热门专题