urllib的实现---timeout,获取http响应码，重定向，proxy的设置

1.Timeout设置超时

只能修改Socket设置全局Timeout

#! /usr/bin/env python3

import socket

import urllib.request

# timeout in seconds

timeout = 2

socket.setdefaulttimeout(timeout)

# this call to urllib.request.urlopen now uses the default timeout

# we have set in the socket module

req = urllib.request.Request('http://www.python.org/')

a = urllib.request.urlopen(req).read()

print(a)

2.获取HTTP响应码

#! /usr/bin/env python3

import urllib.request

req = urllib.request.Request('http://python.org/')

try:  

　　urllib.request.urlopen(req)

except urllib.error.HTTPError as e:

　　print(e.code)

print(e.read().decode("utf8"))

3、异常处理1

 1 #! /usr/bin/env python3

 2

 3 from urllib.request import Request, urlopen

 4

 5 from urllib.error import URLError, HTTPError

 6

 7 req = Request('http://www.python.org/')

 8

 9 try:

10

11 　　response = urlopen(req)

12

13 except HTTPError as e:

14

15 　　print('The (www.python.org)server couldn't fulfill the request.')

16

17 　　print('Error code: ', e.code)

18

19 except URLError as e:

20

21 　　print('We failed to reach a server.')

22

23 　　print('Reason: ', e.reason)

24

25 else:

26

27 　　print("good!")

28

29 　　print(response.read().decode("utf8"))

4、异常处理2

 1 #! /usr/bin/env python3

 2

 3 from urllib.request import Request, urlopen

 4

 5 from urllib.error import  URLError

 6

 7 req = Request("http://www.python.org/")

 8

 9 try:

10

11 　　response = urlopen(req)

12

13 except URLError as e:

14

15 　　if hasattr(e, 'reason'):

16

17 　　　　print('We failed to reach a server.')

18

19 　　　　print('Reason: ', e.reason)

20

21 　　elif hasattr(e, 'code'):

22

23 　　　　print('The server couldn't fulfill the request.')

24

25 　　　　print('Error code: ', e.code)

26

27 else:  print("good!")

28

29 　　print(response.read().decode("utf8"))

5.重定向

import urllib.request
import socket
url = 'https://www.baidu.com'
response =urllib.request.urlopen(url)
isRediercted = response.geturl() == "https：//www.baidu.com"

6.代理设置

import urllib.request

proxy_support = urllib.request.ProxyHandler({'sock5': 'localhost:1080'})

opener = urllib.request.build_opener(proxy_support)

urllib.request.install_opener(opener)

a = urllib.request.urlopen("http://www.python.org/").read().decode("utf8")

print(a)

urllib的实现---timeout,获取http响应码，重定向，proxy的设置的更多相关文章

C# 之【获取网页响应码200】
做了个监控网站的C#项目,判断网站是否运行正常,采用的就是获取HTTP头返回的状态码. 比如状态码为200的就是网站正常,403是Forbidden,404是网页未找到这样. 代码如下: 首先是使用库 ...
HTTP请求的python实现（urlopen、headers处理、 Cookie处理、设置Timeout超时、重定向、Proxy的设置）
python实现HTTP请求的三中方式:urllib2/urllib.httplib/urllib 以及Requests urllib2/urllib实现 urllib2和urllib是python两 ...
HTTP状态码(响应码)
HTTP状态码(响应码)用来表明HTTP请求是否已经成功完成.HTTP响应类型一共分五大类:消息响应,成功响应,重定向,客户端错误,服务器端错误. 下表列出了所有HTTP状态码,以及他们各自所代表的含 ...
http请求返回响应码的意思
HTTP 状态响应码意思详解/大全 HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码.它由 RFC 2616 规范定义的,并得到RFC 2518. ...
HTTP 状态响应码意思详解/大全
HTTP 状态响应码意思详解/大全转:http://blog.csdn.net/helin916012530/article/details/29842595 HTTP状态码(HTTP Statu ...
http请求返回响应码及意义
http 响应码及意义 HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码.它由 RFC 2616 规范定义的,并得到RFC 2518.RFC 281 ...
【python】获取http响应
一个相对完整的http请求,输入ip和端口,输出响应码,响应头,响应体,是否超时,以及出错时的错误信息处理包括: 1.协议处理,如果是443用https,其他用http 2.HTTPError处理, ...
Python3.x获取网页源码
Python3.x获取网页源码 1,获取网页的头部信息以确定网页的编码方式: import urllib.request res = urllib.request.urlopen('http://ww ...
Java学习-055-Jsoup爬虫通过设置获取响应数据大小的最大值，解决因默认获取 1MB 响应数据导致的无法获取全部的响应数据内容问题
在日常工作中,通常会遇到获取各种网络数据使用的情况,Java中可使用Jsoup(Python中可使用 BeatifulSoup)进行数据的获取及处理. 今天有朋友问,在使用 Jsoup 进行请求数据时 ...

随机推荐

Jmeter之上传数据流（图片、文本等）请求
MIME类型~Content-Type: 参数名称~name
正则校验：微信号，qq号，邮箱
java判断微信号.手机.名字的正则表达 - willgos - 博客园https://www.cnblogs.com/solossl/p/5813106.html 微信号正则校验,qq正则,邮箱正则 ...
文件传输协议FTP、SFTP和SCP
网络通信协议分层应用层: HTTP(Hypertext Transfer Protocol 超文本传输协议,显示网页) DNS(Domain Name System) FTP(File Transf ...
Error Boundaries 错误边界
错误边界是用于捕获其子组件树 JavaScript 异常,记录错误并展示一个回退的 UI 的 React 组件,而不是整个组件树的异常.错误边界在渲染期间.生命周期方法内.以及整个组件树构造函数内捕获 ...
Docker操作删除所有容器镜像
借鉴博客:https://www.cnblogs.com/yanyouqiang/p/8301856.html https://blog.csdn.net/wy_97/article/details/ ...
动态渲染页面爬取（Python 网络爬虫） ---Selenium的使用
Selenium 的使用 Selenium 是一个自动化测试工具,利用它可以驱动浏览器执行特定的动作,如点击.下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬.对于一些JavaS ...
Maven最佳实战
Maven中内置的隐藏变量: http://www.cnblogs.com/quanyongan/category/471332.html Maven提供了三个隐式的变量可以用来访问环境变量,POM信 ...
java JSP自定义标签
来至: http://blog.csdn.net/jiangwei0910410003/article/details/23915373 http://blog.csdn.net/jiangwei09 ...
<resultMap>中 <collection>的使用
public class Question implements Serializable { private int id; //问题Id private int accountId; //用户id ...
opencv imdecode和imencode用法
主要是对内存数据自动编解码 string fname = "D:/image.jpg"; //! 以二进制流方式读取图片到内存 FILE* pFile = fopen(fname. ...