python解决urllib2乱码问题

示例：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import urllib

import urllib2

def main():

	url = "http://www.douban.com"

	#浏览器头

	headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

	req = urllib2.Request(url=url,headers=headers)

	data = urllib2.urlopen(req).read()

	print data

	return 0

if __name__ == '__main__':

	main()

打印出来的内容中，汉字为乱码。解决方法：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import urllib

import urllib2

import sys

type = sys.getfilesystemencoding()

def main():

	url = "http://www.douban.com"

	#浏览器头

	headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

	req = urllib2.Request(url=url,headers=headers)

	data = urllib2.urlopen(req).read()

	print data.decode("UTF-8").encode(type)

	return 0

if __name__ == '__main__':

	main()

有关python的encode和decode使用方法參见：http://blog.csdn.net/xyw_blog/article/details/40188037

本文为xyw_Eliot原创。转载请注明出处:http://blog.csdn.net/xyw_blog/article/details/40187913

python解决urllib2乱码问题的更多相关文章

【转】Python BeautifulSoup 中文乱码解决方法
这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输 ...
【已解决】python中文字符乱码（GB2312，GBK，GB18030相关的问题）
http://againinput4.blog.163.com/blog/static/1727994912011111011432810/ [已解决]python中文字符乱码(GB2312,GB ...
解决 python 读取文件乱码问题（UnicodeDecodeError）
解决 python 读取文件乱码问题(UnicodeDecodeError) 确定你的文件的编码,下面的代码将以'utf-8'为例,否则会忽略编码错误导致输出乱码解决方案一 with open(r' ...
python爬虫中文乱码解决方法
python爬虫中文乱码前几天用python来爬取全国行政区划编码的时候,遇到了中文乱码的问题,折腾了一会儿,才解决.现特记录一下,方便以后查看. 我是用python的requests和bs4库来实 ...
解决vs code编写python输出中文乱码问题
环境: win7 vscode 1.37.0 插件: python Code Runner 乱码问题: 创建一个python文件,运行如下代码,打印显示乱码.: 解决乱码步骤: Ctrl+Shift+ ...
22-python爬虫解决gbk乱码问题
转载自: python爬虫解决gbk乱码问题今天尝试了下爬虫,爬取一本小说,忘语的凡人修仙仙界篇,当然这样不好,大家要支持正版. 爬取过程中是老套路,先获取网页源代码 # -*- coding: ...
Sublime Text3 解决中文乱码 & 可用注册码 & 设置默认打开方式
Sublime Text3注册码 Sublime Text Build 3065 License key 复制如下三个任意一个正版注册码即可 -– BEGIN LICENSE -– Andrew We ...
【C#】C#中使用GDAL3（二）：Windows下读写Shape文件及超详细解决中文乱码问题
转载请注明原文地址:https://www.cnblogs.com/litou/p/15035790.html 本文为<C#中使用GDAL3>的第二篇,总目录地址:https://www. ...
增加UBUNTU字符集解决中文乱码问题
对GBK,GB2312,GB18030字符集的支持是UBUNTU中文乱码的罪魁祸首,其实我们可以在保持UTF-8为默认编码的条件下添加对这几个编码的支持,以解决中文乱码问题. 我想这个问题肯定有其他人 ...

随机推荐

一次修复IncrediBuild Coordinator服务的经历
作者:朱金灿来源:http://blog.csdn.net/clever101 早上发现部门的分布式编译服务的服务端崩溃了,原来是IncrediBuild Coordinator服务启动不了.启动该 ...
Centos6.5 VNC 配置
VNC 配置本教程配置说明目的:实现Window下VNC登陆Linux服务器本机是在root用户下操作完毕两台主机已实现基本网络配置,且相互ping通 1. 检查图形界面确保服务器端须要执行 ...
php自定义排序数组usort和uasort（uasort保持索引关联）（usort($arr, "cmp");）（比较函数时很普通函数的写法：function cmp($a, $b)）
php自定义排序数组usort和uasort(uasort保持索引关联)(usort($arr, "cmp");)(比较函数时很普通函数的写法:function cmp($a, $ ...
[Javascript] Understand Function Composition By Building Compose and ComposeAll Utility Functions
Function composition allows us to build up powerful functions from smaller, more focused functions. ...
SQLServer重建索引
Use [数据库名称]Go DECLARE @DBCCString NVARCHAR(1000)DECLARE @TableName VARCHAR(100)DECLARE Cur_Index CUR ...
echart.gl.js实现动态3D柱状图
echart.gl.js实现动态3D柱状图一.总结一句话总结:演示页面的源代码里面一定有所需的所有的js. 二.[js实践篇]——echart.gl.js实现动态3D柱状图前言本公司的项目需求 ...
TCP三次握手和四次握手最直接的理解
网上有非常多文章讲TCP为什么建立连接时须要三次握手,关闭连接时须要四次握手.讲了非常多原理.反而让非常多人难以理解. 事实上仅仅有一句话:TCP连接是两个端点之间的事.因为TCP连接是可靠连接,所以 ...
推荐一款软件mybatis-generator-gui
https://github.com/zouzg/mybatis-generator-gui mybatis-generator-gui mybatis-generator-gui是基于mybatis ...
Sitecore
Sitecore 功能最强大.最丰富的企业级 .NET 网站内容管理系统.包含的功能如下所述: 内容编辑和会话中的个性化用于预览访客所看到的网站内容的体验浏览器设备和地理位置 IP 检测(需要额外 ...
scala 中的修饰符
package cn.scala_base.oop.scalaclass import scala.beans.BeanProperty; /** * scala中的field,类中定义的是方法,函数 ...

python解决urllib2乱码问题

python解决urllib2乱码问题的更多相关文章

随机推荐

热门专题