'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

问题描述：在使用python爬取斗鱼直播的数据时，使用str(读取到的字节，编码格式)进行解码时报错：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

　　代码如下：

from urllib import request

class Spilder():

    url='https://www.douyu.com/'

    def __fetch_content(self):

        r = request.urlopen(Spilder.url)

        htmls = r.read()    #获取字节码（html）

        htmls = str(htmls, encoding='utf-8')

　　

    def go(self):

        self.__fetch_content()

spilder=Spilder()

spilder.go()

问题原因：断点调试的时候发现r.read()获取到的字节码是以‘b’\x1f\x8b\x08’开头的，说明它是gzip压缩过的数据，这也是报错的原因，所以我们需要对我们接收的字节码进行一个解码操作。修改之后的代码如下：

from urllib import request

from io import BytesIO

import gzip

class Spider():

    url = 'https://www.douyu.com/'

    def __fetch_content(self):

        r = request.urlopen(Spider.url)

        htmls = r.read()

        buff = BytesIO(htmls)

        f = gzip.GzipFile(fileobj=buff)

        htmls = f.read().decode('utf-8')

    # 入口方法

    def go(self):

        self.__fetch_content()

spider = Spider()

spider.go()

修改之后解码正常

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte的更多相关文章

Python3 解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
Python3 解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 一.问题 request.Reque ...
Python3 使用requests请求，解码时出错：'utf8' codec can't decode byte 0x8b in position 1: invalid start byte
requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...
解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
"Accept-Encoding": "gzip, deflate", 这条信息代表本地可以接收压缩格式的数据,而服务器在处理时就将大文件压缩再发回客户端,IE ...
使用Python遇到：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 问题
查看你的HTTP头部是否有如下头部信息:"Accept-Encoding": "gzip, deflate" 这条信息代表本地可以接收压缩格式的数据,而服务器在 ...
【python】UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
header中干掉 "Accept-Encoding": "gzip, deflate, br", 注意:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xce in position 47: invalid continuation byte
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 22: invalid continuation byte
在使用python读取文本文件,一般会这样写: # -*- coding:utf-8 -*- f = open("train.txt", "r", encodi ...
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte 觉得有用的话,欢迎一起讨论相互学习~Follow Me 今 ...
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 52: invalid continuation byte
代码: df_w = pd.read_table( r'C:\Users\lab\Desktop\web_list_n.txt', sep=',', header=None) 当我用pandas的re ...

随机推荐

i++ 反编译码
1.特点: 操作数栈,主要用于保存计算过程中的结果,同时作为集计算过程中变量临时的存储空间. 操作数栈就是JVM执行引擎的一个工作区,当方法执行开始,一个新栈帧也会随之被创建,这个方法的操作数栈是空的 ...
DirectX11 With Windows SDK--37 延迟渲染：光源剔除
前言在上一章,我们主要介绍了如何使用延迟渲染,以及如何对G-Buffer进行一系列优化.而在这一章里,我们将从光源入手,讨论如何对大量的动态光源进行剔除,从而获得显著的性能提升. 在此之前假定读者已 ...
CodeGym-17~20
读文章 0.如果是基本数据类型的话,在数组中就存储特定的值:如果是对象的话,在数组中就是存储对象的引用. 1.数组本身就是对象再读文章 0.Arrays.sort(array); Arrays.to ...
Kettle错误记录之couldn't open file XXX
业务背景: 简单的TXT文件入库逻辑组件: 文件文本输入,表输出具体BUG: 这里报错是无法打开文件,在我尝试了多个思路后,最终发现了问题所在. 因为使用的txt文件的格式是Unix的,而我的文本 ...
location 匹配规则
location 匹配规则语法规则 location [=||*|^~] /uri/ { - } 模式含义 location = /uri = 表示精确匹配,只有完全匹配上才能生效 locatio ...
4月11日 python学习总结对象与类
1.类的定义 #类的定义 class 类名: 属性='xxx' def __init__(self): self.name='enon' self.age=18 def other_func: pas ...
Cobalt Strike的安装
一.下载压缩包下载回来之后,可以看到里面的文件有这些: 其中搭建团队服务器端的关键文件有两个,一个是cobaltstrike.jar,另一个是teamserver,这里我打算将团队服务器端搭在我的v ...
CF932G Palindrome Partition(回文自动机)
CF932G Palindrome Partition(回文自动机) Luogu 题解时间首先将字符串 $ s[1...n] $ 变成 $ s[1]s[n]s[2]s[n-1]... $ 就变成了求 ...
XStream类对象把List<javaBean>()转成json数据
[省市联动] Servlet端: XStream把list转成json数据 //JSONArray-->变成数组/集合[] //JSONObject-->变成简单的数据{name:ayee ...
Mysql之锁（二）
1.查看锁 SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX; -- 记录当前运行的事务 SELECT * FROM INFORMATION_SCHEMA.INN ...

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte的更多相关文章

随机推荐

热门专题