有三种方法解决请求后乱码问题。

一：获取二进制数据，再利用str进行编码转换

url='http://music.baidu.com'

r = requests.get(url)

html=r.content

html_doc=str(html,'utf-8') #html_doc=html.decode("utf-8","ignore")

print(html_doc)

二：使用r.text

Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。请求发出后，Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 r.text 之时，Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码，并且能够使用 r.encoding 属性来改变它.
但是Requests库的自身编码为: r.encoding = ‘ISO-8859-1’
可以 r.encoding 修改编码

url='http://music.baidu.com'

r=requests.get(url)

r.encoding='utf-8'

print(r.text)

三：apparent_encoding获取网页编码

上面的两个方法，适用于网页编码是utf-8的情况，但如果网页的默认编码不是utf-8，那么在设置编码的话就无从下手的，毕竟编码的类型那么多。这样可以使用 apparent_encoding获取网页使用的编码，在进行设置，如下：

import requests

url='http://www.upandashi.com/cjwt/155.html'

r=requests.get(url)

print(r.apparent_encoding)

r.encoding=r.apparent_encoding

print(r.text)

参考文章：https://www.cnblogs.com/liuliu-word/p/9910197.html

***************不积跬步无以至千里***************

requests乱码问题的更多相关文章

Requests 乱码
当使用Requests请求网页时,出现下面图片中的一些乱码,我就一脸蒙逼. 程序是这样的. def getLinks(articleUrl): headers = { "Uset-Agent ...
爬虫学习之-requests乱码
总体功能的一个演示 import requests response = requests.get("https://www.baidu.com") print(type(resp ...
java web 学习十（HttpServletRequest对象1）
一.HttpServletRequest介绍 HttpServletRequest对象代表客户端的请求,当客户端通过HTTP协议访问服务器时,HTTP请求头中的所有信息都封装在这个对象中,通过这个对象 ...
python（27）requests 爬取网页乱码，解决方法
最近遇到爬取网页乱码的情况,找了好久找到了种解决的办法: html = requests.get(url,headers = head) html.apparent_encoding html.enc ...
Python HTTP库requests中文页面乱码解决方案！
http://www.cnblogs.com/bitpeng/p/4748872.html Python中文乱码,是一个很大的坑,自己不知道在这里遇到多少问题了.还好通过自己不断的总结,现在遇到乱码的 ...
Python3的requests类抓取中文页面出现乱码的解决办法
这种乱码现象基本上都是编码造成的,我们要转到我们想要的编码,先po一个知识点,嵩天老师在Python网络爬虫与信息提取说到过的:response.encoding是指从HTTP的header中猜测 ...
Requests中文乱码解决方案
分析: r = requests.get(“http://www.baidu.com“) **r.text返回的是Unicode型的数据. 使用r.content返回的是bytes型的数据. 也就是说 ...
解决requests获取源代码时中文乱码问题
用requests获取源代码时,如果是中文网页,就可能会出现乱码,下面我以中关村的网站为例: import requests url = 'http://desk.zol.com.cn/meinv/' ...
python中requests库中文乱码问题
当使用这个库的时候经常会出现各种乱码的情况. 首先要知道: text返回的是处理过的unicode的数据. content返回的是bytes的原始数据也就是说r.content比r.text更加节省 ...

随机推荐

java 整合redis缓存 SSM 后台框架 rest接口 shiro druid maven bootstrap html5
A 调用摄像头拍照,自定义裁剪编辑头像,头像图片色度调节B 集成代码生成器 [正反双向](单表.主表.明细表.树形表,快速开发利器)+快速表单构建器 freemaker模版技术 ,0个代码不用写,生成 ...
c#使用CefSharp开发winform——环境搭建
因为nuget在线下载有时候很慢,所以下载nuget包,进行本地安装登陆nuget官网https://www.nuget.org/下载相关资源选择对应版本进行下载,同时需要下载相关依赖的包最 ...
JS---DOM---元素创建的不同方式---三种方式，5个案例
元素创建-----为了提高用户的体验元素创建的三种方式: 1. document.write("标签的代码及内容"); 2. 对象.innerHTML="标签及代码 ...
My Home Page
Recently I use github student pack to build my personal home page.
CSS 学习手册
目录 CSS 简介 1.CSS 简介 CSS 概述层叠次序 2.CSS 基础语法 CSS 语法值的不同写法和单位记得写引号多重声明: 空格和大小写 3.CSS 高级语法选择器的分组继承及其 ...
Appium(四)：真实机第一个appium程序、模拟器第一个appium程序、查看元素
1. 真实机第一个appium程序学完了前面的知识,也将环境搭建好了,接下来我们就正式开始appium的学习了. 在做app自动化的时候,我们肯定是针对某个产品.某个软件进行测试,那么我们一定是先让 ...
TypeScript初体验
第一次运行TypeScript 1.创建文件夹并初始化项目 mkdir ts-demo cd ts-demo npm init -y 2.安装typescript与ts-node # 局部安装 npm ...
ResultSet RS_resultxtgg=connDbBean.executeQuery(sqlxtgg);
<%String sqlxtgg="select * from dx where leibie='系统公告'"; ResultSet RS_resultxtgg=connDb ...
Linux下安装Redis以及遇到的问题
参考链接:https://www.cnblogs.com/zdd-java/p/10288734.html https://www.cnblogs.com/uncleyong/p/9882843.ht ...
alter对话框处理：
from selenium import webdriverd = webdriver.Firefox()d.get('file://C:\\我的代码\\selenium自动化测试\\alter.ht ...

requests乱码问题

一：获取二进制数据，再利用str进行编码转换

二：使用r.text

三：apparent_encoding获取网页编码

requests乱码问题的更多相关文章

随机推荐

热门专题