python中文本的读写操作
文本的操作
函数的排序操作:
def func(i):
return i[2]
list=[('曹操',101,'c'),('吕布',100,'d'),('刘备',200,'l'),('大乔',50,'x')]
list.sort(key=func)
#如果自己写个排序算法,无法如何都要把里面的值取出来一次的
print(list)
文本的读写操作:
##往文件内写入数据,覆盖写入
f=open(r"E:\实习\编程\01\day06\1.txt",'w')
data=f.write('xxxxxxxxxxxx')
f.close()
##将文本中的内容读出来
f=open(r"E:\实习\编程\01\day06\1.txt",'r')
data=f.read()
print(data)
f.close
##将一张图片读出来
f=open(r"E:\实习\编程\01\day06\2.jpg",'rb')
data=f.read()
print(data)
f.close
词频统计:
英文:
f=open(r'E:\实习\编程\01\day06\22.txt','r') ##打开文件
data=f.read().lower() ##将文件内的内容转换为小写
data_split=data.split(' ') ##以空格进行分割
count_dict={} ##创建一个空字典
for word in data_split: ##开始for循环,判断word是否在字典内如果不
if word not in count_dict: ##在字典内初始值为1,如果在字典内加一
count_dict[word]=1
else:
count_dict[word]+=1
def func(i): ##定义一个func函数,把字典转换成一个列表
return i[1]
lt=list(count_dict.items())
lt.sort(key=func) ##把列表进行倒序排序
lt.reverse()
for i in lt[0:10]: ##用for循环循环列表并输出
print(f'{i[0]:^7}{i[1]^5}')
中文:
import jieba
f=open(r'E:\实习\编程\01\day06\threekingdoms.txt','r',encoding='utf8')
data=f.read()
data_jieba = jieba.lcut(data)
count_dict={}
for word in data_jieba:
if len(word)==1:
continue
if word in {"将军","却是","荆州","二人","不可","不幸","却说","不能","如此","商议","如何","追赶","二十余","听令","不计其数","欣然","大汉","丞相","主公","军士","左右","军马","不如","赶来","引兵","次曰","荆州","大喜","朝廷","当先","传令","次日","天下","东吴","于是","今日","不敢","魏兵","陛下"}:
continue
if '曰' in word:
word=word.replace('曰','')
if '云长' in word:
word=word.replace('云长','关公')
if word in count_dict:
count_dict[word]+=1
else:
count_dict[word]=1
def func(i):
return i[1]
data_list=list(count_dict.items())
data_list.sort(key=func)
data_list.reverse()
for i in data_list[0:10]: ##用for循环循环列表并输出
print(f'{i[0]:^7}{i[1]^5}')
词云:
import wordcloud
from imageio import imread
mask=imread(r'E:\实习\编程\01\day06\1.png')
f=open(r'E:\实习\编程\01\day06\22.txt','r',encoding='utf8')
data=f.read()
w=wordcloud.WordCloud(font_path=r'C:\Windows\Fonts\simfang',mask=mask,width=500,height=600,
background_color="white")
w.generate(data)
w.to_file('outfile.png')

python中文本的读写操作的更多相关文章
- 『无为则无心』Python基础 — 41、Python中文件的读写操作(一)
目录 1.文件操作步骤 2.文件的读写操作 (1)文件的打开 (2)打开文件模式 (3)获取一个文件对象 (4)关于文件路径 1.文件操作步骤 当我们要读取或者写入文件时,我们需要打开文件,在操作完毕 ...
- Python中文件的读写操作的几种方法
对文件的操作,步骤为:打开一个文件-->读取/写入内容-->保存文件 文件读写的3中模式 # 1.w 写模式,它是不能读的,如果用w模式打开一个已经存在的文件,会清空以前的文件内容,重新写 ...
- Python中文件的读写操作
文件操作基本流程: 1. 介绍 计算机系统是由计算机硬件,操作系统,和应用程序三部分组成. 内存 存放不持久 硬盘 可以使数据持久化 文件操作 数据持久化的一种 全栈开发 框架类 2. 文件的操作 ...
- 『无为则无心』Python基础 — 42、Python中文件的读写操作(二)
目录 (5)文件对象方法(重点) 1)写方法 2)读方法 3)seek()方法 4)tell()方法 (6)关闭 (7)综合练习:读取大文件 (5)文件对象方法(重点) 1)写方法 @1.语法 对象对 ...
- Python中的文件IO操作(读写文件、追加文件)
Python中文件的读写包含三个步骤:打开文件,读/写文件,关闭文件. 文件打开之后必须关闭,因为在磁盘上读写文件的功能是由操作系统提供的,文件作为对象,被打开后会占用操作系统的资源,而操作系统在同一 ...
- 【python系统学习17】python中的文件读写
python中的文件读写 文件读写,是Python代码调用电脑文件的主要功能,能被用于读取和写入文本.音频片段.Excel文档.邮件以及任何保存在电脑上的东西. 可使用python批量的操作本地文件, ...
- 使用Python对Excel进行读写操作
学习Python的过程中,我们会遇到Excel的读写问题.这时,我们可以使用xlwt模块将数据写入Excel表格中,使用xlrd模块从Excel中读取数据.下面我们介绍如何实现使用Python对Exc ...
- 【转】python 历险记(四)— python 中常用的 json 操作
[转]python 历险记(四)— python 中常用的 json 操作 目录 引言 基础知识 什么是 JSON? JSON 的语法 JSON 对象有哪些特点? JSON 数组有哪些特点? 什么是编 ...
- Python—对Excel进行读写操作
学习Python的过程中,我们会遇到Excel的读写问题.通过搜索得知,我们可以使用xlwt module将数据写入Excel表格,使用xlrd module从Excel读取数据.下面介绍如何实现使用 ...
随机推荐
- 虚拟机win7 安装过程中遇到虚拟工具安装失败
如果遇见这样的问题 倘若你用的是这样的镜像:cn_windows_7_enterprise_x64_dvd_x15-70741.iso 换镜像源.换镜像源.换镜像源! 换成带sp1的iso镜像:cn_ ...
- 《Head first设计模式》学习笔记 – 迭代器模式
<Head first设计模式>学习笔记 – 迭代器模式 代器模式提供一种方法顺序访问一个聚合对象中的各个元素,而又不暴露其内部的表示. 爆炸性新闻:对象村餐厅和对象村煎饼屋合并了!真是个 ...
- DataPipeline王睿:业务异常实时自动化检测 — 基于人工智能的系统实战
大家好,先自我介绍一下,我是王睿.之前在Facebook/Instagram担任AI技术负责人,现在DataPipeline任Head of AI,负责研发企业级业务异常检测产品,旨在帮助企业一站式解 ...
- TP5和TP3.2的使用区别
模板标签不一样: TP5 可在配置文件中自行定义自己喜欢的标签 TP5 使用双标签 如:{foreach} {/foreach} TP3 : <> TP5 :{} 调用数据表方式: M( ...
- goto语句的本质
除非跳出多个循环嵌套和远程注入技术,否则尽量少用goto goto会降低程序的可读性,让代码难以调试 利用递归也可以实现循环结构和do while类似 #define _CRT_SECURE_NO_W ...
- 2019-08-04 纪中NOIP模拟B组
T1 [JZOJ3403] 数列变换 题目描述 小X看到堆成山的数列作业十分头疼,希望聪明的你来帮帮他.考虑数列A=[A1,A2,...,An],定义变换f(A,k)=[A2,A3,...,Ak,A1 ...
- EF database first
https://www.cnblogs.com/net064/p/8024150.html 1.EF简介ADO.NET Entity Framework 是微软以 ADO.NET 为基础所发展出来的对 ...
- 6.mybatis----日志工厂
日志工厂 如果一个数据库操作出现了异常,我们需要排错,所以说日志就是最好的助手 曾经:sout,debug 现在:日志工厂 在Mybatis中具体使用哪一个日志,在设置中设定 咋设定? 在mybati ...
- 用git无法连接github的解决方法
如果要從 GitHub 存取 Git 儲存庫,建議還是多採用 SSH 與 HTTPS 通訊協定最為穩定可靠,因此我的替代方案就是設定 Git 的全域設定值 ( –global ),預設將所有 git: ...
- 每天进步一点点------Xilinx IP 内核
ISE 设计套件 11.1 版本中提供了众多全新的 IP 内核.数学函数:Multiply Adder v2.0 —— 执行两个操作数的乘法,并采用 XtremeDSP™ 解决方案切片将完全精确的乘积 ...