Python之读写文本数据

知识点不多

一：普通操作

# rt 模式的 open() 函数读取文本文件

# wt 模式的 open() 函数清除覆盖掉原文件，write新文件

# at 模式的 open() 函数添加write新文件

with open("../../testData","rt",encoding="utf-8") as f :

    for line in f :

        print(line)

# 写操作默认使用系统编码，可以通过调用 sys.getdefaultencoding() 来得到,也以通过传递一个可选的 encoding 参数给open()函数，几个常见的编码是ascii, latin-1, utf-8和utf-16

# 关于换行符的识别问题：在Unix和Windows中是不一样的(分别是 \n 和 \r\n )。 默认情况下，Python会以统一模式处理换行，识别普通换行符并将其转换为单个 \n 字符

# 如果你不希望这种默认的处理方式，可以给 open() 函数传入参数 newline=''

f =open('somefile.txt', 'rt', newline='')

# 最后一个问题就是文本文件中可能出现的编码错误

# 如果修改了编码方式之后，编码错误还是存在的话，你可以给 open() 函数传递一个可选的 errors 参数来处理这些错误。

m = open('sample.txt', 'rt', encoding='ascii', errors='replace')

# 如果你经常使用 errors 参数来处理编码错误，也是不好的。

# 原则是确保你总是使用的是正确编码。当模棱两可的时候，就使用默认的设置(通常都是UTF-8)。

二：打印输出至文件中

with open('../../testData', 'at') as f:

    print('Hello python!', file=f)

# 使用其他分隔符或行终止符打印

# 使用 print() 函数输出数据，但是想改变默认的分隔符或者行尾符,使用sep  end

print("hello","cool","zzy",sep="***",end="!")   # hello***cool***zzy!

#使用  str.join()

print("***".join(("hello","cool","zzy")))  # hello***cool***zzy

# 对比

row = ("hello","cool","zzy")

print(*row,sep="***")   # hello***cool***zzy

三：读写字节数据

# 读写二进制文件，比如图片，声音文件,使用模式为 rb 或 wb 的 open() 函数

# 在读取二进制数据的时候，字节字符串和文本字符串的语义差异可能会导致一个潜在的陷阱:索引和迭代动作返回的是字节的值而不是字节字符串

a='Hello World'

print(a[0])   # H

b = b'Hello World'  # Byte string

print(b[0])  # 72  索引和迭代动作返回的是字节的值而不是字节字符串

# 如果你想从二进制模式的文件中读取或写入文本数据，必须确保要进行解码和编码操作

# 解码

with open("../../testDta","rb") as f :

    data=f.read(16)

    text=data.decode("utf-8")

# 编码

with open("../../testDta","wb") as d :

    text="hello"

    f.write(text.encode("utf-8"))

四：文件不存在才能写入

一个替代方案是先测试这个文件是否存在，像下面这样：

import os

if not os.path.exists("../../testData"):

    with open("../../testData", "wt") as f:

        f.write("")

else:

    print('File already exists!')

最优解决

# 文件中写入数据,不允许覆盖已存在的数据，可以用"xt",这个参数会判断文件是否已经存在(不管是否有内容，也不管内容是怎样的)，如果有会报错FileExistsError:

with open("../../testData","wt") as f :

    f.write("")

with open("../../testData","xt") as f :

    f.write("你好")    # FileExistsError: [Errno 17] File exists: '../../testData'

五：读压缩文件

import gzip

with gzip.open('somefile.gz', 'rt') as f:

    text = f.read()

# bz2 compression

import bz2

with bz2.open('somefile.bz2', 'rt') as f:

    text = f.read()

# 写入压缩数据

import gzip

with gzip.open('somefile.gz', 'wt') as f:

    f.write(text)

# bz2 compression

import bz2

with bz2.open('somefile.bz2', 'wt') as f:

    f.write(text)

读写压缩数据  如果你不指定模式，那么默认的就是二进制模式，如果这时候程序想要接受的是文本数据，那么就会出错。
gzip.open() 和 bz2.open() 接受跟内置的 open() 函数一样的参数， 包括 encoding，errors，newline 等等。
可以使用 compresslevel 这个可选的关键字参数来指定一个压缩级别，默认的等级是9，也是最高的压缩等级。等级越低性能越好，但是数据压缩程度也越低。

with gzip.open('somefile.gz', 'wt', compresslevel=5) as f:

    f.write(text)

六：固定大小记录的文件迭代

from functools import partial

RECORD_SIZE= 32

# somefile.data是二进制文件

with open('somefile.data', 'rb') as f:

    records = iter(partial(f.read, RECORD_SIZE), b'')

    for r in records:

        ...

Python之读写文本数据的更多相关文章

背水一战 Windows 10 (89) - 文件系统: 读写文本数据, 读写二进制数据, 读写流数据
[源码下载] 背水一战 Windows 10 (89) - 文件系统: 读写文本数据, 读写二进制数据, 读写流数据作者:webabcd 介绍背水一战 Windows 10 之文件系统读写文本数 ...
Python数据类型之“文本序列(Text Sequence)”
Python中的文本序列类型 Python中的文本数据由str对象或字符串进行处理. 1.字符串字符串是Unicode码值的不可变序列.字符串字面量有多种形式: 单引号:'允许嵌入"双&q ...
【转】Python数据类型之“文本序列(Text Sequence)”
[转]Python数据类型之“文本序列(Text Sequence)” Python中的文本序列类型 Python中的文本数据由str对象或字符串进行处理. 1.字符串字符串是Unicode码值的不 ...
IO流-文本IO\读写二进制数据
文本IO 一.简述 OutputStreamWriter类使用选定的编码方式吧Unicode字符流转换为字节流,InputStreamReader类将包含字节的输入流转为可以产生Unicode字符的读 ...
10、NFC技术：读写NFC标签中的文本数据
代码实现过程如下: 读写NFC标签的纯文本数据.java import java.nio.charset.Charset; import java.util.Locale; import androi ...
Python文本数据互相转换（pandas and win32com）
(工作之后,就让自己的身心都去休息吧) 今天介绍一下文本数据的提取和转换,这里主要实例的转换为excel文件(.xlsx)转换world文件(.doc/docx),同时需要使用win32api,同py ...
[Python] 糗事百科文本数据的抓取
[Python] 糗事百科文本数据的抓取源码 https://github.com/YouXianMing/QiuShiBaiKeText import sqlite3 import time im ...
Python数据分析之Pandas读写外部数据文件
1 引言数据分析.数据挖掘.可视化是Python的众多强项之一,但无论是这几项中的哪一项都必须以数据作为基础,数据通常都存储在外部文件中,例如txt.csv.excel.数据库.本篇中,我们来捋一捋 ...
python处理文本数据
处理文本数据,主要是通过Seris的str访问.遇到NaN时不做任何处理,保留结果为NaN,遇到数字全部处理为NaN. str是Seris的方法,DataFrame不能直接使用,但是通过索引选择Dat ...

随机推荐

Linux架构之Nginx 负载均衡会话保持
案例No.50:Nginx负载均衡会话保持前期准备环境 web01.web02 (web01.web02.db01.nfs01都要优化基本源)[root@web01 ~]# vim /etc/yum ...
Redis分布式锁【实战】
概述目前几乎很多大型网站及应用都是分布式部署的,分布式场景中的数据一致性问题一直是一个比较重要的话题.分布式的CAP理论告诉我们“任何一个分布式系统都无法同时满足一致性(Consistency).可 ...
VNware上安装虚拟机Ubuntu16.10 并安装petalinux
1.下载 VMware VMware-workstation-full-15.0.0-10134415.exe 自己寻找激活码 Ubuntu镜像 UG1144 PetaLinux Tools Docu ...
css3-css3属性选择器
在HTML中,通过各种各样的属性可以给元素增加很多附加的信息.例如,通过id属性可以将不同div元素进行区分. 在CSS2中引入了一些属性选择器,而CSS3在CSS2的基础上对属性选择器进行了扩展,新 ...
Spring如何解决循环依赖问题
目录 1. 什么是循环依赖? 2. 怎么检测是否存在循环依赖 3. Spring怎么解决循环依赖本文主要是分析Spring bean的循环依赖,以及Spring的解决方式. 通过这种解决方式,我们可 ...
阿里云ECS VSFTP上传本地文件
开始终端购买云服务,获得公网IP,内网IP 控制台首页获得获得终端连接密码连接终端,输入连接密码获得终端界面,进入终端上传文件 ## .安装VSFTP服务器程序 yum install vs ...
免插件，简单实现上拉加载loading
上拉加载是前端经常遇到的问题,采用插件往往能够轻松解决,这里介绍一种免插件简单实现上拉加载的方法,参考一下,下面分享一下代码. html <body> <ul> <li& ...
编译原理--NFA/DFA
现成的, 讲义: https://www.cnblogs.com/AndyEvans/p/10240790.html https://www.cnblogs.com/AndyEvans/p/10241 ...
Usage of hdf2v3 and hdf2file
备注修改Filetype,再执行hdf2file或hdf2tab,可以输出不同类型的数据.把Filetype设置成8,就是 Tecplot 格式的数据. <!DOCTYPE html PUBL ...
Axios 安卓4.4不兼容的问题
问题:Vue在使用Axios做接口请求时,如果是安卓4.4系统会发生报错,原因是安卓4.4不支持ES6的Promise语法解决方案: 1.安装: npm install babel-polyfill ...

Python之读写文本数据

Python之读写文本数据的更多相关文章

随机推荐

热门专题