Python实用黑科技——找出序列里面出现次数最多的元素

需求：
如何从一个序列中快速获取出现次数最多的元素。

方法：
利用collections.Counter类可以解决这个问题，特别是他的most_common()方法更是处理此问题的最快途径。比如，现在有一个单词的序列，你想快速获取哪个单词出现频率最高，就可以这么做：

In [22]: words = ['look', 'into', 'my', 'eyes', 'look', 'into',
...: 'my', 'eyes', 'the', 'eye', 'the', 'eyes', 'not',
...: 'around', 'the', 'eyes', "don't", 'look', 'around',
...: 'the', 'eyes', 'look', 'into', 'my', 'eyes', "you're",
...: 'under'
...: ]

In [23]: from collections import Counter
In [24]: word_counts = Counter(words)
In [25]: print(word_counts.most_common(3))
[('eyes', 6), ('look', 4), ('the', 4)]

事实上，Counter对象是一个元素和其数目对应关系所构成的字典，例如：

In [26]: word_counts['not']
Out[26]: 1
In [27]: word_counts['into']
Out[27]: 3

扩展：
如果你想手动扩展单词数目，可以使用下面的方式：

In [28]: more_words = ['why', 'are', 'you', 'not', 'looking', 'in',
...: 'my', 'eyes']
In [29]: for word in more_words:
...: word_counts[word] += 1
...: # word_counts.update(more_words)
In [30]: word_counts['eyes']
Out[30]: 7

Counter类还有一些类似于数学运算的方法，使用起来也是相当方便：

In [31]: a = Counter(words)

In [32]: b = Counter(more_words)

In [33]: a
Out[33]:
Counter({'around': 2,
"don't": 1,
'eye': 1,
'eyes': 6,
'into': 3,
'look': 4,
'my': 3,
'not': 1,
'the': 4,
'under': 1,
"you're": 1})

In [34]: b
Out[34]:
Counter({'are': 1,
'eyes': 1,
'in': 1,
'looking': 1,
'my': 1,
'not': 1,
'why': 1,
'you': 1})

In [35]: c = a + b

In [36]: c
Out[36]:
Counter({'are': 1,
'around': 2,
"don't": 1,
'eye': 1,
'eyes': 7,
'in': 1,
'into': 3,
'look': 4,
'looking': 1,
'my': 4,
'not': 2,
'the': 4,
'under': 1,
'why': 1,
'you': 1,
"you're": 1})

In [37]: d = b - a

In [38]: d
Out[38]: Counter({'are': 1, 'in': 1, 'looking': 1, 'why': 1, 'you': 1})

Python实用黑科技——找出序列里面出现次数最多的元素的更多相关文章

【python cookbook】【数据结构与算法】12.找出序列中出现次数最多的元素
问题:找出一个元素序列中出现次数最多的元素是什么解决方案:collections模块中的Counter类正是为此类问题所设计的.它的一个非常方便的most_common()方法直接告诉你答案. # ...
【python cookbook】找出序列中出现次数最多的元素
问题 <Python Cookbook>中有这么一个问题,给定一个序列,找出该序列出现次数最多的元素.例如: words = [ 'look', 'into', 'my', 'eyes', ...
Python实用黑科技——找出最大/最小的n个元素
需求: 快速的获取一个列表中最大/最小的n个元素. 方法: 最简便的方法是使用heapq模组的两个方法nlargest()和nsmallest(),例如: In [1]: import heapqIn ...
python之Counter类：计算序列中出现次数最多的元素
Counter类:计算序列中出现次数最多的元素 from collections import Counter c = Counter('abcdefaddffccef') print('完整的Cou ...
Java实现找出数组中重复次数最多的元素以及个数
/**数组中元素重复最多的数 * @param array * @author shaobn * @param array */ public static void getMethod_4(int[ ...
[PY3]——找出一个序列中出现次数最多的元素/collections.Counter 类的用法
问题怎样找出一个序列中出现次数最多的元素呢? 解决方案 collections.Counter 类就是专门为这类问题而设计的, 它甚至有一个有用的 most_common() 方法直接给了你答案 c ...
剑指Offer：找出数组中出现次数超过一半的元素
题目:找出数组中出现次数超过一半的元素解法:每次删除数组中两个不同的元素,删除后,要查找的那个元素的个数仍然超过删除后的元素总数的一半 #include <stdio.h> int ha ...
Python中用max()筛选出列表中出现次数最多的元素
1 List = [1,2,3,4,2,3,2] # 随意创建一个只有数字的列表 2 maxTimes = max(List,key=List.count) # maxTimes指列表中出现次数最多的 ...
python 找出字符串中出现次数最多的字母
# 请大家找出s=”aabbccddxxxxffff”中出现次数最多的字母 # 第一种方法,字典方式: s="aabbccddxxxxffff" count ={} for i ...

随机推荐

设计模式:状态模式(Status)
在介绍状态模式之前,我们先来看这样一个实例:你公司力排万难终于获得某个酒店的系统开发项目,并且最终落到了你的头上.下图是他们系统的主要工作(够简单). 当你第一眼看到这个系统的时候你就看出来了这是一个 ...
2019中山纪念中学夏令营-Day20[JZOJ] T1旅游详解
2019中山纪念中学夏令营-Day20[JZOJ] 提高组B组 Team_B组 T1 旅游 Time Limits: 2000 ms Memory Limits: 262144 KB Descrip ...
从入门到自闭之Python三大器--生成器
1.什么是生成器核心:生成器的本质就是一个迭代器迭代器是python自带的的生成器是程序员自己写的一种迭代器编写方式: 基于函数编写推导式编写 def func (): print(&quo ...
python-day10(正式学习)
目录字符编码计算机基础文本编辑器存取文件的原理 python解释器执行py文件的原理 python解释器与文本编辑的异同字符编码介绍字符编码的分类乱码分析总结文件操作三种基本操作文 ...
Spring 自定义注解，结合AOP，配置简单日志注解（转）
java在jdk1.5中引入了注解,spring框架也正好把java注解发挥得淋漓尽致. 下面会讲解Spring中自定义注解的简单流程,其中会涉及到spring框架中的AOP(面向切面编程)相关概念. ...
A Horrible Poem （字符串hash+数论）
# 10038. 「一本通 2.1 练习 4」A Horrible Poem [题目描述] 给出一个由小写英文字母组成的字符串 $S$,再给出 $q$ 个询问,要求回答 $S$ 某个子串的最短循环节. ...
P3488 [POI2009]LYZ-Ice Skates
传送门这一题基础是二分图匹配,并且要知道一个 $Hall$ 定理:对于二分图能完全匹配的充要条件是,设点数少的那边为左边,点数为 $n$,对于 $k \in [1,n]$ ,左边任意 $k$ 个点, ...
Leetcode简单题
# Title Solution Acceptance Difficulty Frequency 1 Two Sum 44.5% Easy 2 Add Two Number ...
redis 学习（15）-- GEO
GEO GEO 简介 Redis 3.2添加新特性功能:存储经纬度.计算两地距离.范围计算等基于ZSet实现删除操作使用 zrem key member GEO 相关命令 1.geoadd ke ...
【electronjs入门教程】electronjs 介绍
官网地址:https://electronjs.org/ 官网文档地址:https://electronjs.org/docs/ electronjs使用 JavaScript, HTML 和 CSS ...

Python实用黑科技——找出序列里面出现次数最多的元素

Python实用黑科技——找出序列里面出现次数最多的元素的更多相关文章

随机推荐

热门专题