爬取网页内容后写入文件报错UnicodeEncodeError: 'gbk' codec can't encode的问题解决方案

老猿使用如下代码读取网页内容: req = urllib.request.Request(url=url,headers=header) text = urllib.request.urlopen(req).read().decode() fp = open(r'c:\temp\testhtml.txt','a+') fp.write(text) fp.close() 执行时读取网页内容都没有问题,在写入文件时报错: fp.write(text) UnicodeEncodeError: 'gbk…

python写入文件中遇到 UnicodeEncodeError: ‘gbk’ codec can’t encode character 错误的解决办法

在写入TXT文件时,某些页面总是报UnicodeEncodeError: ‘gbk’ codec can’t encode character错误,网上找了半天也没找到解决办法. 后来终于找到了解决办法,十分简单:在f = open('英语练习.txt','a+',encoding='utf-8') 里加上encoding='utf-8'这个参数就行了. 出错的原因是网页及python的编码都是utf-8,在写进txt时Windows默认转码成gbk,遇到某些gbk不支持的字符就会报错. 在打开…

【python】python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence

python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence 示例代码: fileName = 'E:/2/采集数据_pswf12_180大0小35750_20181206.txt' currentFile = open(fileName) content = currentFile.read() print(content) 报错原因: 要…

关于编码问题，报错：'gbk' codec can't encode character '\u3164' in position 0: illegal multibyte sequence

之前经常在写入文件的时候遇到这种报错, 'gbk' codec can't encode character '\u3164' in position 0: illegal multibyte sequence 之前的解决方式是使用try...except语句把报错的不写入,这样虽然能解决程序报错停止的问题,但是会少写入一些信息网上各种解答都没什么用,试过了根本没法解决问题,于是今天用自己理解的方式尝试,居然成功了: 解决同样是try...except语句,只不过多一个except写入的方式…

Python读取中文txt文件错误：UnicodeEncodeError: 'gbk' codec can't encode character

with open(file,'r') as f: line=f.readline() i=1 while line: line=line.decode('utf-8') line=f.readline() i=i+1 用以上代码读取一个包含中文的txt文件时,在正确地读取并打印了六百多行之后,print str(i)+": "+line这一行报错: UnicodeEncodeError: 'gbk' codec can't encode character u'\u200b' in…

python 写入日志的问题 UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte sequence

最近,使用python的logging模块,因为这个写入日志写完后就没有管它.在存储日志信息的时候,一直提示: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte sequence 还是以为是文件编码有问题,困扰了很久,其实是在写入日志时候提示的编码错误. 所以,需要对日志函数做一定的修改,编码改为utf-8 def get_logger(log_file):…

python+selenium运行报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

使用python+selenium运行自动化脚本时,打印某一段文字出现UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)报错. 原因:编码未进行转换. 解决方式:print时,在后面加上encode("utf-8")即可. 例如: tx = driver.find_element_by_xpath(".//*[@id='1']/…

python3 读取dbf文件报错 UnicodeDecodeError: 'gbk' codec can't decode

在读取dbf文件时由于编码问题报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xb5 in position 49: incomplete multibyte sequence from dbfread import DBF # f = open('beauty.DBF', encoding='gbk',errors="ignore") table = DBF('beauty.DBF',encoding='gbk') #遍历数…

python中time.strftime不支持中文，报错UnicodeEncodeError: 'locale' codec can't encode character '\u5e74' in position 2: encoding error

使用time.strftime将 "2020-10-10 10:10:10" 转化为 2020年10月10日10时10分10 报错: import time timestr="2020-10-10 10:10:10" t=time.strptime(timestr,"%Y-%m-%d %H:%M:%S") print(time.strftime("%Y年%m月%d日 %H时%M分%S秒",t)) 根据错误可以看出,没有执行成…

pip安装requests报错unicodeEncodeError:'ascii' codec can\t encode charactesers in position 9-12:ordinal not in range(128)

前提 : 已经安装pip(pip的安装我参考的是本博客转载脚本之家的步骤,实验可以成功) 1. 在cmd输入命令转到pip安装目录: 2. 运行后出现错误 3. 步骤2中的错误应该和编码有关.搜索百度后,解决方法: 转自:joy32812 在你python的安装目录下的Lib目录,找到site.py,修改def setencoding()方法def setencoding(): ..... .... if 0: # Enable to support locale aware default s…

python写文件时遇到UnicodeEncodeError: 'gbk' codec can't encode character的解决方式

在window平台,文件的默认编码是gbk, 此时如果写入的字符串的编码是utf-8就会引发这种错误,打开文件的编码必须与字符串的编码一致 with open('content.txt','w',encoding='utf-8') as f: r.write() 这样就不会报错原创链接:https://blog.csdn.net/life_is_too_hard/article/details/78384562…

python报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 22-26: ordinal not in range(128)”问题解决

方案是在python的Lib\site-packages文件夹下新建一个sitecustomize.py,内容为: # encoding=utf8 import sys reload(sys) sys.setdefaultencoding('utf8') 此时重启python解释器,执行sys.getdefaultencoding(),发现编码已经被设置为utf8的了,多次重启之后,效果相同,这是因为系统在python启动的时候,自行调用该文件,设置系统的默认编码,而不需要每次都手动的加上解决代…

python读取txt文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x8e in position 8: illegal multibyte sequence

python读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x8e in position 8: illegal multibyte sequence,如下代码: #coding:utf-8 import shutil readDir = "F:\\爬取数据\\11.txt" writeDir = "F:\\爬取数据\\22.txt" #txtDir = "/home/fuxueping/…

Python报错：UnicodeEncodeError 'gbk' codec can't encode character

今天在使用Python文件处理写网络上爬取的文件的时候,遇到了错误:UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position … 这个问题. 代码: import urllib.request #等价与from urllib import request response = urllib.request.urlopen("http://www.baidu.com") print("查看…

解决python编码问题报错：'ascii' codec can't encode characters in position 0-15: ordinal not in range(128)

这个问题很奇怪,在服务器上执行一个写数据库的python文件,正常执行,但是使用java的ssh进行调用脚本,发现就是不执行数据库的写入,然后使用了try except的方式,打印了错误信息,发现报错: 'ascii' codec can't encode characters in position 0-15: ordinal not in range(128) 解决方案: 在python文件中加入以下3句话 import sys reload(sys) sys.setdefaultencod…

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib 在python3读取txt文件时,遇到上面问题是因为: txt文件存的是utf8编码,打开文件的时候没有指定编码,文件虽然是utf8编码,但是在计算机里面存储的还是unicode编码数据,即计算机是将文件的内容按照utf8编码成unicode后存到了硬盘上,而现在执行f.read()的时候,因为没…

报错处理（UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 2: ill egal multibyte sequence）

参照文[https://blog.csdn.net/Dillon2015/article/details/53204955]的说法, 第一个错 [UnicodeEncodeError:'gbk' codec can't encode character '\xa9' in position 0:illegal multibyte sequence] 这个错误,网上给出的解释是: 某些软件如notepad,在保存一个以UTF-8编码的文件时, 会在文件开始的地方插入三个不可见的字符(0xEF 0x…

python 爬虫写入txt：UnicodeEncodeError: ‘gbk’ codec can’t encode character 错误的解决办法

原链接:https://blog.csdn.net/vito21/article/details/53490435 今天爬一个网站的内容,在写入TXT文件时,某些页面总是报UnicodeEncodeError: ‘gbk’ codec can’t encode character错误,网上找了半天也没找到解决办法. 后来终于找到了解决办法,十分简单:在f = open('英语练习.txt','a+',encoding='utf-8') 里加上encoding='utf-8'这个参数就行了. 出错…

Xcode升级10.3后XIB文件报错

Xcode升级10.3后XiB文件包错,提示: Failed to find or create execution context for description '<IBCocoaTouchPlatformToolDescription: 0x7fefbefd1d80> System content for IBCocoaTouchFramework-EightAndLater <IBScaleFactorDeviceTypeDescription: 0x7fefbebf4f70&g…

python 格式化时间含中文报错： 'locale' codec can't encode character '\u5e74'

执行下面代码报错: UnicodeEncodeError: 'locale' codec can't encode character '\u5e74' in position 2: Illegal byte sequence import time print(time.strftime("%Y年%m月%d日 %H时%M分%S秒",time.localtime())) 报错原因为有中文字符,修改为下面代码即可 import time print(time.strftime('%Y{y…

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence

python读取文件时提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence" 解决办法1. FILE_OBJECT= open('order.log','r', encoding='UTF-8') 解决办法2. FILE_OBJECT= open('order.log','rb')…

vue2.0 项目build后资源文件报错404的解决方案

当vue项目build后,我们会看到css.js报错404的问题: 那我们就去找错误原因吧. 首先,查看build后的dist文件目录可以看出,js.css在index.html的同级目录下: 然后,查看index.html,看到下面的代码 <script type=text/javascript src=/static/js/app.41ce5f66426864089c57.js></script> 我们先普及下文件路径的知识 ../上级目录 ./同级目录 /根目录…

Windows 10 执行pip list报错 UnicodeDecodeError: 'gbk' codec can't decode

在命令行执行任何pip命令都报错: C:\Users\hyang0>pip --version Traceback (most recent call last): File "c:\python3\lib\runpy.py", line 193, in _run_module_as_main "__main__", mod_spec) File "c:\python3\lib\runpy.py", line 85, in _run_cod…

中文数据解码报错 UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence 失败原因:原文件中文是UTF-8编码,现在用gbk解码则会报错,编码和解码方法不一致所致: 解决办法:先确认原文件数据的编码格式,然后再确认现在对文件数据的解码格式,需确保编码格式和解码格式一致. lines[i].decode('utf-8').encode('gbk')或者unicode(lines[i]…

python 编码报错问题 'ascii' codec can't encode characters 解决方法

python在安装时,默认的编码是ascii, 当程序中出现非ascii编码时,python的处理常常会报这样的错 'ascii' codec can't encode characters python没办法处理非ascii编码的, 此时需要自己设置将python的默认编码,一般设置为utf8的编码格式. 查看python的默认编码 print sys.getdefaultencoding() 解决方法一(已通过验证,顺带也解决了我之前字符前一直加u的问题) 在python安装目录下,进入\P…

Pandas读取文件报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte

pandas读取文件时报UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte 我们需要在读取时,设置encoding='gbk',即可…

python3读文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x9f in position 2: illegal multibyte sequence

…

Python - requests发送请求报错：UnicodeEncodeError: 'latin-1' codec can't encode characters in position 13-14: 小明 is not valid Latin-1. Use body.encode('utf-8') if you want to send it encoded in UTF-8.

背景在做接口自动化的时候,Excel作为数据驱动,里面存了中文,通过第三方库读取中文当请求参数传入 requests.post() 里面,就会报错 UnicodeEncodeError: 'latin-1' codec can't encode characters in position 13-14: Body ('小明') is not valid Latin-1. Use body.encode('utf-8') if you want to send it encoded in UTF…

webpack 打包压缩 ES6文件报错UglifyJs + Unexpected token punc ((); 或者 Unexpected token: operator (>)

webpack 打包压缩 ES6文件报错UglifyJs + Unexpected token punc ((); 或者 Unexpected token: operator (>) 解决方案就是将babel配置转义到 .babelrc 文件中.具体做法是在根目录新建 .babel,输入 { "presets": ["es2015"] } 在webpack加载babel-loader的时候会自动加载.babelrc配置的.…

python print 打印的数据包含中文，打印报错UnicodeDecodeError: 'gbk' codec can't decode bytes in position 459-460: illegal multibyte sequence解决办法

python 2.7 print 的数据中若包括中文,打印则会报错UnicodeDecodeError: 'gbk' codec can't decode bytes in position 459-460: illegal multibyte sequence, 错误原因:将一个字符串,通过gbk的方式,去解码,想要获得Unicode字符串出错了,一般是因为解码的方式与其原编码方式不一致所致,比如该数据编码格式是utf-8,你却用gbk去解码,当然出错,“解码方式和编码方式要保持一致”,你应该…

【爬取网页内容后写入文件报错UnicodeEncodeError: 'gbk' codec can't encode的问题解决方案】的更多相关文章