(改进)Python语言实现词频统计
需求:
1.设计一个词频统计的程序。
2.英语文章中包含的英语标点符号不计入统计。
3.将统计结果按照单词的出现频率由大到小进行排序。
设计:
1.基本功能和用法会在程序中进行提示。
2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。
代码如图所示:
1.导入程序所需模块。

2.定义readfile类,实现去除文章中标点符号的功能。


3.定义一个getstr类,对结果输出格式进行定义。

4.构造程序主函数。

测试用例:
测试用例我选择了马丁.路德.金的演讲稿。

部分测试结果如图所示:

我也看了杨老师对其他同学提出的要求,例如试着跑一跑《战争与和平》这本英语书籍,可能是由于字码数过大,没有运行处结果。

以上是我的程序的展示,不足之处请老师给予批注,谢谢老师。
(改进)Python语言实现词频统计的更多相关文章
- c语言实现词频统计
		
需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率. 2.文章中包含的标点不计入统计. 3.将统计结果以从大到小的排序方式输出. 设计: 1.因为是跨专业0.0···并不会c++和java, ...
 - 用Python实现一个词频统计(词云+图)
		
第一步:首先需要安装工具python 第二步:在电脑cmd后台下载安装如下工具: (有一些是安装好python电脑自带有哦) 有一些会出现一种情况就是安装不了词云展示库 有下面解决方法,需看请复制链接 ...
 - Python3.7 练习题(二) 使用Python进行文本词频统计
		
# 使用Python进行词频统计 mytext = """Background Industrial Light & Magic (ILM) was starte ...
 - Python字典使用--词频统计的GUI实现
		
字典是针对非序列集合而提供的一种数据类型,字典中的数据是无序排列的. 字典的操作 为字典增加一项 dict[key] = value students = {"Z004":&quo ...
 - C语言实现词频统计——第二版
		
原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符. 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命 ...
 - 利用python实现简单词频统计、构建词云
		
1.利用jieba分词,排除停用词stopword之后,对文章中的词进行词频统计,并用matplotlib进行直方图展示 # coding: utf-8 import codecs import ma ...
 - python实现简易词频统计-源码
		
需求:给瓦尔登湖文章统计单词出现的频率 思路:首先读取文件并以空格分割得到列表,然后利用for循环遍历列表中的元素并把去掉列表元素中的符号,第三步去掉相同的元素,将列表转换为一个字典,最后按照键值对升 ...
 - python:Hamlet英文词频统计
		
#CalHamletV1.py def getText(): #定义函数读取文件 txt = open("hamlet.txt","r").read() txt ...
 - 用Python来进行词频统计
		
# 把语料中的单词全部抽取出来, 转成小写, 并且去除单词中间的特殊符号 def words(text): return re.findall('[a-z]+', text.lower()) def ...
 
随机推荐
- [Message123] JMS 与 MQ
			
https://www.cnblogs.com/steven520213/p/6810369.html JMS的队列消息传递过程如下图(消费者与生产者): JMS的主题消息传递过程如下图(发布/订阅) ...
 - Zookeeper入门(三)之工作流
			
一旦ZooKeeper集合启动,它将等待客户端连接.客户端将连接到ZooKeeper集合中的一个节点.它可以是leader或follower节点.一旦客户端被连接,节点将向特定客户端分配会话ID并向该 ...
 - oracle中over函数
			
1.oracle中按一个字段分组排序后取第一条数据. SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY 分组字段 ORDER BY 排序字符 D ...
 - 记录因xen而导致lvs,realserver转发activeconn为0
			
8.81----vip,keepalived 8.82----realserver 8.83----realserver 8.84----realserver 在8.81上ipvsadm -Ln的时候 ...
 - OpenCV——图像的深度与通道数讲解
			
矩阵数据类型: – CV_(S|U|F)C S = 符号整型 U = 无符号整型 F = 浮点型 E.g.: CV_8UC1 是指一个8位无符号整型单通道矩阵, CV_32FC2是指一个32位浮点型双 ...
 - 剑指offer.找出数组中重复的数字
			
题目: 给定一个长度为 n 的整数数组 nums,数组中所有的数字都在 0∼n−1 的范围内.数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次.请找出数组中任意一个重复的数 ...
 - C++的命名空间的使用
			
C++语言引入命名空间(Namespace)这一概念主要是为了避免命名冲突,其关键字为 namespace. 科技发展到如今,一个系统通常都不会仅由一个人来开发完成,不同的人开发同一个系统,不可避免地 ...
 - 何谓BLDC电机?BLDC电机是如何旋转的?
			
何谓BLDC电机?BLDC电机是如何旋转的?
 - FFmpeg编程学习笔记二:音频重採样
			
ffmpeg实现音频重採样的核心函数swr_convert功能很强大,但是ffmpeg文档对它的凝视太过简单.在应用中往往会出这样那样的问题,事实上在读取数据->重採样->编码数据的循环中 ...
 - git reset之后找回本地未提交的代码
			
头脑发热使用了git reset命令回退到了之前的一个版本,结果把本地没有提交的代码给覆盖掉了..... 作为一个bug员自然是想恢复,毕竟重新写还得再测一遍,本着能懒一点是一点的原则,开始了恢复代码 ...