Python学习笔记015——readline与readlines的区别
示例1
读取同样一个文件binary_read_1.txt。
春眠不觉晓,处处闻啼鸟。 夜来风雨声,花落知多少。
其中该文件内容被下段代码读出(注意,这里是采用的readlines)
f = open("binary_output_1.txt", 'rb')
b = f.readlines() #b 绑定资源句柄 字节串
if type(b) == str:
print("b是字符串")
elif type(b) == bytes:
print("b是字节串")
else:
print("b是其它类型")
print(b)
f.close()
运行结果:
b是其它类型 [b'\xe6\x98\xa5\xe7\x9c\xa0\xe4\xb8\x8d \xe8\xa7\x89\xe6\x99\x93\xef\xbc\x8c\xe5 \xa4\x84\xe5\xa4\x84\xe9\x97\xbb\xe5\x95 \xbc\xe9\xb8\x9f\xe3\x80\x82\n', b'\xe5\xa4 \x9c\xe6\x9d\xa5\xe9\xa3\x8e\xe9\x9b\xa8 \xe5\xa3\xb0\xef\xbc\x8c\xe8\x8a\xb1\xe8 \x90\xbd\xe7\x9f\xa5\xe5\xa4\x9a\xe5\xb0 \x91\xe3\x80\x82\n']
运行结果是每段开始以b‘’包含字符串,形成字节串。原文件换行处以\n结尾。
如果该文件被下段代码读取(注意,这里是采用的readline)
f = open("binary_output_1.txt", 'rb')
b = f.readline() #b 绑定资源句柄 字节串
if type(b) == str:
print("b是字符串")
elif type(b) == bytes:
print("b是字节串")
else:
print("b是其它类型")
print(b)
f.close()
运行结果
b是字节串 b'\xe6\x98\xa5\xe7\x9c\xa0\xe4\xb8\x8d \xe8\xa7\x89\xe6\x99\x93\xef\xbc\x8c\xe5 \xa4\x84\xe5\xa4\x84\xe9\x97\xbb\xe5\x95 \xbc\xe9\xb8\x9f\xe3\x80\x82\n'
对比两个代码的运行结果:
readlines()显示的为非字节串,而readline()显示的为字节串,实际内容一致。
示例2
读取同样一个文件binary_read_2.txt。
ABCDEFabcdef012345 2
用下段代码读取
f = open("binary_output_2.txt", 'rb')
b = f.readlines() #b 绑定资源句柄 字节串
if type(b) == str:
print("b是字符串")
elif type(b) == bytes:
print("b是字节串")
else:
print("b是其它类型")
print(b)
f.close()
运行结果:
b是其它类型 [b'ABCDEFabcdef012345\n', b'\n']
若采用readline()读取
f = open("binary_output_2.txt", 'rb')
b = f.readline() #b 绑定资源句柄 字节串
if type(b) == str:
print("b是字符串")
elif type(b) == bytes:
print("b是字节串")
else:
print("b是其它类型")
print(b)
f.close()
运行结果
b是字节串 b'ABCDEFabcdef012345\n'
为什么readline()读取时为字节串,readlines()读取时为其他类型呢?
因为当readline()读取时,将原文件行内容进行了转换,以b''形式将其转变成字节串形式;
当readlines()读取信息时,以换行符为结尾形成字节串,同时将字节串为元素组成列表,所以为其他形式
为什么应为字母和数字在转换字节串时直接输出,而汉字则时不能直接显示?
在字节串bytes中,当字节值超出ASCII字符范围内时,会以\x##形式显示字节流,其中三个\x##形式代表一个汉字
例如
>>> b'\xe6\x98\xa5'.decode('utf-8',errors="ignore")
'春'
详细信息可以参考廖雪峰博客的python-字符串和编码部分
Python学习笔记015——readline与readlines的区别的更多相关文章
- Python学习笔记015——文件file的常规操作之一(文本文件)
1 什么是文件 文件是用于数据存储的单位 文件通常用来长期保存数据 读写文件是最常见的I/O操作.Python内置了读写文件的函数,用法和C是兼容的. 读写文件的功能都是由操作系统提供的,一般而言,操 ...
- Python学习笔记015——文件file的常规操作之三(标准输入输出文件)
1 标准输入输出文件 在Python中,模块sys中含有标准的输入输出文件 sys.stdin 标准输入方法(一般是键盘) sys.stdout 标准输出方法(到显示器的缓冲输出) sys ...
- Python学习笔记015——汉字编码
1 字符串的编码(encode)格式 GB2312 GBK GB18030 UTF-8 ASCII 其中常用的编码格式有 国标系列:GB18030(GBK(GB2312)) (window ...
- Python学习笔记015——文件file的常规操作之四(输入重定向)
windows命令提示符(cmd.exe)和Linux Shell(bash等)均可通过">"或”>>“将输出重定向.其中, ">"表示 ...
- Python学习笔记015——文件file的常规操作(二进制文件)
有时候诸如图片.音乐等信息不是以文本的形式存储的,而是二进制文件格式存储的. 有时候很多信息不是以文本文件的形式存储的 很多时候,都需要用到二进制读取文件.毕竟很多信息不是以文本的形式存储.例如:图片 ...
- Python学习笔记015——序列(字节数组 bytearray)
1 序列 常见的序列有:list tuple str bytes(字节串) bytearray 2 字节数组bytearray 可变的字节序列,相当于bytes的可变版本. 3 创建函数by ...
- Python学习笔记015——文件file的常规操作seek()及tell()
1 seek() 1.1 概述 file.seek()用于将文件游标移动到文件的任意位置,便于对文件的当前位置(增.删.改.查)操作 1.2 语法 fileObject.seek(offset[, w ...
- python中read、readline、readlines的区别
read直接读入整个文件,存成一个字符串变量 readline一行一行读入文件,所以说读取的文件可以大于内存,但是读取的速度很慢 readlines一次读取整个文件,存成一个列表,所以说也必须小于内存 ...
- python中read、readline和readlines的区别
read 读取整个文件 readline 读取下一行 readlines 读取整个文件到一个迭代器以供我们遍历(读取到一个list中,以供使用,比较方便). 123.txt内容 ...
随机推荐
- seqgan leakgan
seqgan https://blog.csdn.net/yinruiyang94/article/details/77675586 leakgan https://www.leiphone.com/ ...
- Oracle—RMAN完全恢复
一.RMAN完全恢复的相关概念 1.在RMAN完全恢复中主要使用两个命令,一个是restore,另一个是recover. 2.可以在三个级别恢复,数据库,表空间,数据文件. 3.RMAN中应对于各种情 ...
- 编写和执行C#代码的插件:CS-Script for Notepad++
这个插件可以方便得让您在Notepad++编辑器中编辑和执行C#代码(脚本).它具备通用的C#智能感知和项目任务管理功能,方式非常类似于MS Visual Studio.除了这一点,它提供了通用的调试 ...
- 关于css优先级
css的优先级从低到高依次是:内部样式表的优先级为(1,0,0,0),id选择器优先级为(0,1,0,0),class选择器为(0.0,1,0),tag标签为(0.0,0,1).除此之外,!impor ...
- Android Studio安装&&安装bug
1.安装SDK:Android SDK安装 2.安装Android Studio 3.配置HTTP Proxy: 转自:Android Studio设置HTTP代理(可用) 因为大陆的内网的防火墙很厉 ...
- 【Flash 插件】时钟类插件
1.honehone_clock人体时钟实现 原理:就是在网页上播放已写好的.SWF文件. 效果如下: 效果一:背景透明,推荐为白色或浅背景 效果二:背景白色,推荐黑色或深色背景 实现步骤: 先引用 ...
- ufldl学习笔记与编程作业:Softmax Regression(vectorization加速)
ufldl学习笔记与编程作业:Softmax Regression(vectorization加速) ufldl出了新教程,感觉比之前的好.从基础讲起.系统清晰,又有编程实践. 在deep learn ...
- PHP导出word,CVS,PDF
WORD: <?php header("Cache-Control: no-cache, must-revalidate"); header("Pragma: no ...
- Firefox 之 应用小结
1. 调试脚本 做前端开发的朋友应该对FireFox再熟悉不过了,FireFox有一个附加组件FireBug.在HTML中可以直接写 <script type="tex ...
- Android 四大组件之 Activity(一)
1.Activity的定义及作用: Android系统中的四大组件之一,可以用于显示View.Activity是一个与用户交互的系统模块,几乎所有的Activity都是和用户进行交互的一个应用程序的组 ...