1、错误现象

环境：Python3.7

描述：

用open方法获取文件句柄；
用read/readlines方法一次读取文件所有内容；
尝试了编码GB2312/GBK/GB18030/UTF-8，发现UnicodeDecodeError报错没有解决。
查看读取的文件。是txt的文件，文件大小30-50MB左右。
用notepad++打开这个文件，发现正常打开，发现编码是GB2312

下面是报错过程：

Python 3.7.2 (tags/v3.7.2:9a3ffc0492, Dec 23 2018, 23:09:28) [MSC v.1916 64 bit (AMD64)]

Type 'copyright', 'credits' or 'license' for more information

IPython 7.3.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: f = open('test.txt', encoding='GB2312')

In [2]: lines = f.readlines()

---------------------------------------------------------------------------

UnicodeDecodeError                        Traceback (most recent call last)

<ipython-input-2-d1e99c5e7da7> in <module>

----> 1 lines = f.readlines()

UnicodeDecodeError: 'gb2312' codec can't decode byte 0xf4 in position 7927: illegal multibyte sequence

2、资料查阅

查阅资料过程：

UnicodeDecodeError为关键字查阅资料。发现几乎所有资料都是指定encoding。
查阅python官方文档。文档中关于open方法的说明。然后发现有参数errors。这个参数默认是strict，即有异常即报错。官方文档说明可以设置为ignore，这样忽略错误。

3、错误解决

解决的python代码：

  1: In [3]: f = open('test.txt', encoding='GB2312', errors='ignore')

2:

  3: In [4]: l = f.readlines()

4:

  5: In [5]:

4、回顾

这个问题困扰了我将近半天的时间，发现尝试编码不能解决后，就做别的事情去了。过了一会儿突然就想看看官方说明，然后就发现了官方文档的解决办法。

所以觉得官方文档真的是一个取之不尽用之不竭的宝库。遇到问题多看官方文档，这是一个好习惯。

5、参考

官方参考文档：

open方法的官方说明：https://docs.python.org/3/library/functions.html#open
open方法支持的编码说明：https://docs.python.org/3/library/codecs.html#module-codecs
关于open方法获取的文件句柄报错处理的参考：https://docs.python.org/3/library/codecs.html#codec-base-classes

Python读取内容UnicodeDecodeError错误的更多相关文章

Python读取文件编码及内容
Python读取文件编码及内容最近做一个项目,需要读取文件内容,但是文件的编码方式有可能都不一样.有的使用GBK,有的使用UTF8.所以在不正确读取的时候会出现如下错误: UnicodeDecode ...
Python运行Google App Engineer时出现的UnicodeDecodeError错误解决方案
#Python运行Google App Engineer时出现的UnicodeDecodeError错误解决方案 ##问题描述使用Python2.7.x运行GAE时有时会报这个错误 ```py ...
解决 python 读取文件乱码问题（UnicodeDecodeError）
解决 python 读取文件乱码问题(UnicodeDecodeError) 确定你的文件的编码,下面的代码将以'utf-8'为例,否则会忽略编码错误导致输出乱码解决方案一 with open(r' ...
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib ...
【python】python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte ...
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence
python读取文件时提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal m ...
【转】Python——读取html的table内容
Python——python读取html实战,作业7(python programming) 查看源码,观察html结构 # -*- coding: utf-8 -*- from lxml.html ...
Python读取文件内容与存储
Python读取与存储文件内容一..csv文件读取: import pandas as pd souce_data = pd.read_csv(File_Path) 其中File_path是文件的 ...
python读取excel中单元格的内容返回的5种类型
(1) 读取单个sheetname的内容. 此部分转自:https://www.cnblogs.com/xxiong1031/p/7069006.html python读取excel中单元格的内容返回 ...

随机推荐

Spring学习（一）IOC
Spring是一站式框架: (1)Spring在javaee三层结构中,每一层都提供不同的解决技术. web层:SpringMVC service层:Spring的Ioc dao层:Spring的J ...
xmanger图形化登陆远程服务器
由于网上的资料比较杂,经过本人整理实际操作验证,保证ok 本人的服务器系统为centos5.8 下面的都是centos服务器上的操作,需要简单的配置下: win客户端使用xmanger软件:首先是服 ...
Quartz.NET实现作业调度（3.0版本实现）定时执行一个任务
2.0版本请参考https://www.cnblogs.com/best/p/7658573.html这里的文章很详细: 我们现在想每5秒钟往txt文件夹里存储一个时间首先:定义一个类,实现Quar ...
Json数组对象和对象数组
Json的简单介绍从结构上看,所有的数据最终都可以分成三种类型: 第一种类型是scalar(标量),也就是一个单独的string(字符串)或数字(numbers),比如“北京”这个单独的词. 第二种 ...
Servlet高级部分Filter（过滤器）
一:Filter称之为"过滤器",用在Servlet外,对request和response进行修改.它是AOP(面向切面编程思想的一种体现),Filter中有一个FilterCha ...
Flask蓝图的增删改查
怎样用flask蓝图来实现增删改查呢?请看下面的内容这是我们的目录结构从图中可以看出每一个功能都有一个各自的文件夹首先我们要自己先来创建一个数据,在Flask_data.py中写入如下内容: S ...
eaysui 子页面刷新父页面datagrid
近期碰到这样一个问题,子页面操作后需要刷新父页面datagrid元素,刚开始用这种方式刷新,$("#talbe",window.parent.document).datagrid( ...
Vue.js（2.x）之列表渲染（v-for/key）
1.v-for是Vue里的循环语句,与其他语言的循环大同小异.首先得有需要循环且不为空的数组,循环的关键字为in或of. 需要索引时的写法: v-for里的in可以使用of代替: 还可以使用v-for ...
ArcGIS中经纬度数据转空间数据
已有这样一批数据,后缀为.txt 或者.csv .现需要将其转化为空间数据. 转换过程: 打开ArcMap选择file——>Add Data——>Add XY Data 设置经纬度对应的字 ...
SpringBoot JUnit4的断言和注解
Junit4的断言常用方法: assertArrayEquals( new Object[]{ studentService.likeName("小明2").size() > ...

Python读取内容UnicodeDecodeError错误

1、错误现象

2、资料查阅

3、错误解决

4、回顾

5、参考

Python读取内容UnicodeDecodeError错误的更多相关文章

随机推荐

热门专题