【python】python2.x 与 python3.x区别对照+缩进错误解决方法

仅仅列出我用到的，不全。

划重点：

　　1. urllib2 用 urllib.request 代替

　　2. urllib.urlencode 用 urllib.parse.urlencode 代替

　　3. cookielib 用 http.cookiejar 代替

　　4. print " " 用 print(" ") 代替

　　5. urllib2.URLError 用 urllib.error.URLError 代替

　　6. urllib2.HTTPError 用 urllib.error.HTTPError 代替

　　7. except urllib2.URLError, e: 用 except urllib.error.URLError as e: 代替

在python3.4.3自带的IDLE中写代码，经常出现缩进错误，很难查找。

解决方案：拷贝到Notepad++里面，视图中显示空格和制表符，就可以明显看出问题在哪了。

设置了header的网络请求，在Python2.x中的写法

import urllib

import urllib2  

url = 'http://www.server.com/login'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

values = {'username' : 'kzy',  'password' : '' }

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)

request = urllib2.Request(url, data, headers)

response = urllib2.urlopen(request)

page = response.read()

在Python3.x中的写法

import urllib.parse

import urllib.request

url = 'http://www.baidu.com'

user_agent = 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.93 Safari/537.36'

values = {'username':'kzy','password':''}

headers = {'User-Agent':user_agent}

data = urllib.parse.urlencode(values).encode(encoding='UTF8') #这里要指明编码方式

request = urllib.request.Request(url, data, headers)

response = urllib.request.urlopen(request)

page = response.read()

我在学习静觅的爬虫教程，照着把里面的基础部分的代码都写了一遍。

教程地址：http://cuiqingcai.com/1052.html

里面原本的代码都是2.x的，我全部用3.x学着写了一遍。如下：

import urllib.parse

import urllib.request

"""

response = urllib.request.urlopen("http://www.baidu.com")

print(response.read())

"""

"""

#设置了header和data的请求

url = 'http://www.baidu.com'

user_agent = 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.93 Safari/537.36'

values = {'username':'kzy','password':'123'}

headers = {'User-Agent':user_agent}

data = urllib.parse.urlencode(values).encode(encoding='UTF8')

request = urllib.request.Request(url, data, headers)

response = urllib.request.urlopen(request)

page = response.read()

"""

"""

#设置代理  避免因为某个IP的访问次数过多导致的禁止访问

enable_proxy = True

proxy_handler = urllib.request.ProxyHandler({"http":'http://some-proxy.com:8080'})

null_proxy_handler = urllib.request.ProxyHandler({})

if enable_proxy:

    opener = urllib.request.build_opener(proxy_handler)

else:

    opener = urllib.request.build_opener(null_proxy_handler)

urllib.request.install_opener(opener)    

"""

"""

#设置Timeout

response = urllib.request.urlopen('http://www.baidu.com', timeout = 10)

"""

"""

#使用http的 put或delete方法

url = 'http://www.baidu.com'

request = urllib.request.Request(url, data=data)

request.get_method = lambda:'PUT' #or 'DELETE'

response = urllib.request.urlopen(request)

"""

"""

#使用DebugLog 把收发包的内容在屏幕上打印出来 方便调试

httpHandler = urllib.request.HTTPHandler(debuglevel=1)

httpsHandler = urllib.request.HTTPSHandler(debuglevel=1)

opener = urllib.request.build_opener(httpHandler, httpsHandler)

urllib.request.install_opener(opener)

response = urllib.request.urlopen('https://its.pku.edu.cn/netportal/netportal_UTF-8.jsp', timeout = 5)

"""

"""

#URLError异常处理

from urllib.error import URLError, HTTPError

request = urllib.request.Request('http://www.baidu.com')

try:

    urllib.request.urlopen(request, timeout = 5)

except HTTPError as e:

    print('Error code:', e.code)

except URLError as e:

       print('Reason:', e.reason)

"""

"""

#URLError异常处理 属性判断

request = urllib.request.Request('https://its.pku.edu.cn/netportal/netportal_UTF-8.jsp')

try:

    urllib.request.urlopen(request, timeout = 5)

except urllib.error.URLError as e:

    if hasattr(e, "code"):     #hasattr 判断变量是否有某个属性

        print(e.code)

    if hasattr(e, "reason"):

        print(e.reason)

else:

    print("OK")

"""

"""

#获取cookie保存到变量

import http.cookiejar

#声明一个CookieJar对象实例来保存cookie

cookie = http.cookiejar.CookieJar()

#利用HTTPCookieProcessor对象来创建cookie处理器

handler = urllib.request.HTTPCookieProcessor(cookie)

#通过handler来构建opener

opener = urllib.request.build_opener(handler)

#此处的open方法同urlopen

response = opener.open('https://its.pku.edu.cn/netportal/netportal_UTF-8.jsp')

for item in cookie:

    print('Name = '+item.name)

    print('Value = '+item.value)

"""

"""

#获取cookie保存到文件

import http.cookiejar

#设置保存的文件

filename = 'cookie.txt'

#声明一个MozillaCookieJar对象实例来保存cookie，之后写入文件

cookie = http.cookiejar.MozillaCookieJar(filename)

#创建cookie处理器

handler = urllib.request.HTTPCookieProcessor(cookie)

#构建opener

opener = urllib.request.build_opener(handler)

response = opener.open("https://its.pku.edu.cn/netportal/netportal_UTF-8.jsp")

#保存到cookie文件

cookie.save(ignore_discard=True,ignore_expires=True)

"""

"""

#从文件中获取cookie并访问

import http.cookiejar

#创建MozillaCookieJar实例对象

cookie = http.cookiejar.MozillaCookieJar()

#从文件中读取cookie内容到变量

cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True)

#创建请求的request

req = urllib.request.Request('https://its.pku.edu.cn/netportal/netportal_UTF-8.jsp')

#创建opener

opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))

response = opener.open(req)

print(response.read())

"""

#模拟登陆 登陆不成功

import http.cookiejar

filename = 'cookie.txt'

cookie = http.cookiejar.MozillaCookieJar(filename)

opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))

postdata = urllib.parse.urlencode({'stuid':'******','pwd':'******'}).encode(encoding='UTF8') #这里怎么知道名字分别是stuid和pwd呢？？？

loginUrl = 'http://xxxxxx.com'

result = opener.open(loginUrl, postdata)

cookie.save(ignore_discard=True, ignore_expires=True)

gradeUrl='http://xxxxxx.com'

result = opener.open(gradeUrl)

print(result.read())

【python】python2.x 与 python3.x区别对照+缩进错误解决方法的更多相关文章

Python 排错UnicodeEncodeError 'ascii' codec can't encode character 错误解决方法
Python UnicodeEncodeError 'ascii' codec can't encode character 错误解决方法 by:授客 QQ:1033553122 错误描述: py ...
Python更新pip出现错误解决方法
Python更新pip出现错误解决方法更新pip python -m pip install --upgrade pip 查看时报错解决方法在命令栏(即win+r)输入:easy_install ...
Python决策树可视化：GraphViz's executables not found的解决方法
参考文献: [1]Python决策树可视化:GraphViz's executables not found的解决方法
python使用pip安装第三方模块遇到的问题及解决方法
python使用pip安装第三方模块遇到的问题及解决方法关注公众号"轻松学编程"了解更多. 使用国内源: 清华:https://pypi.tuna.tsinghua.edu.cn ...
python之路-python2.x与python3.x区别
Python崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. Python2.x 与 Python3.x的区别: python2.x:源码混乱,重复代码较多,冗余. python3.x:源码规范,崇 ...
Python语言基础-语法特点、保留字与标识符、变量、基本数据类型、运算符、基本输入输出、Python2.X与Python3.X区别
Python语言基础 1.Python语法特点注释: 单行注释:# #注释单行注释分为两种情况,例:第一种#用于计算bim数值bim=weight/(height*height)第二种:bim=we ...
python2.X与Python3.X区别
__future__模块 [回到目录] Python 3.x引入了一些与Python 2不兼容的关键字和特性,在Python 2中,可以通过内置的__future__模块导入这些新内容.如果你希望在P ...
windows python3.7安装numpy问题的解决方法
我的是win7的系统,去python官网下载python3.7安装 CMD #打开命令窗口 pip install numpy #在cmd中输入提示需要c++14.0, 解决办法: 1, 进入h ...
Python学习：ModuleNotFoundError: No module named 'pygal.i18n' 的解决方法
最近在学<Python编程:从入门到实践>,16.2小结中 from pygal.i18n import COUNTRIES 获取两个字母的国别码,我用的pygal的版本是2.4.0(终端 ...

随机推荐

linux备忘录-日志档案
linux的日志档案 linux的日志档案记录系统或程序在运行过程中产生的一些信息,例如事件的记录,错误的记录等等.特别是在发生错误时,我们可以通过日志档案找到错误发生的根源,例如当我们无法启动邮件服 ...
【转】 The user specified as a definer ('root'@'') does not exist when using LOCK TALBE
在linux下,用mysql的导出语句: mysqldump -u root -pPasswd table >/home/lsf/test.sql 出现了 Got error: 1449: Th ...
安装并配置maven
1下载Maven 2添加仓库(仓库就是maven项目统一存放依赖的地方根据groupId ArtifactId Version来组成项目依赖路径) conf——settings.xml------- ...
ArcGis融合小多边形到相邻多边形
在有的时候,我们的数据中可能会有许多细小的图斑,这些并不是我们想要的,需要将它们合并到周围的图斑中,如果一个一个手动合并,那工作量之大简直不敢想象.现在借助ArcGIS的Eliminate工具可 ...
Delphi xe7组件和控件的安装方法
暂时我所遇到的所有控件安装方法大体与下面两种相同. 若有不同大家提出来,一起想办法解决. .dproj格式的组件安装方法: raise组件安装详细步骤如下: 一.设置搜索路径1. 将本包中的文件连同 ...
将CRUD封装到一个工具类中
package org.zln.hibernate.utils; import org.hibernate.Session; import org.hibernate.SessionFactory; ...
Spark分布式执行原理
Spark分布式执行原理让代码分布式运行是所有分布式计算框架需要解决的最基本的问题. Spark是大数据领域中相当火热的计算框架,在大数据分析领域有一统江湖的趋势,网上对于Spark源码分析的文章有 ...
【bzoj3362/3363/3364/3365】[Usaco2004 Feb]树上问题杂烩并查集/树的直径/LCA/树的点分治
题目描述农夫约翰有N(2≤N≤40000)个农场,标号1到N,M(2≤M≤40000)条的不同的垂直或水平的道路连结着农场,道路的长度不超过1000.这些农场的分布就像下面的地图一样, 图中农场用F ...
11大精选Android自学网站
无论是从事什么开发,只要是软件行业,不断的更新迭代自己掌握的知识是少不了的.相信干过程序猿的童鞋都清楚,如果要在技术上有所提升,工作之余的不断学习是少不了的.今天小编为大家分享的就是一些比较有用的学习 ...
CTSC && APIO 行程记录
CTSC: 第一天,看着三道题,只觉得第三题可做.于是写了第一题的暴力就开始写第三题的题答,第二题看了萨菲克斯阿瑞的名字就感觉不会写呀.然而第三题只能胡搞乱搞就只有28分. D1 5 + 0 + 28 ...

【python】python2.x 与 python3.x区别对照+缩进错误解决方法

【python】python2.x 与 python3.x区别对照+缩进错误解决方法的更多相关文章

随机推荐

热门专题