使用urllib3实现http请求

Urllib3是一个功能强大，条理清晰，用于HTTP客户端的Python库，许多Python的原生系统已经开始使用urllib3。

1.发送请求

import urllib3

# 创建实例

http = urllib3.PoolManager()

#发送请求

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html')

2.设置请求头信息

In [ ]:

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

In [ ]:

import urllib3

http = urllib3.PoolManager()

# 请求头处理

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

3.防止连接不稳定

In [ ]:

#增加timeout参数设置方法1

import urllib3

http = urllib3.PoolManager()

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

#为防止因为网络不稳定、服务器不稳定等问题造成连接不稳定时的丢包，可以在请求中增加timeout参数设置，通常为浮点数。

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head, timeout=3.0)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

In [ ]:

#增加timeout参数设置方法2

import urllib3

http = urllib3.PoolManager()

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head,

                  timeout=urllib3.Timeout(connect=1.0, read=2.0))

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

In [ ]:

#增加timeout参数设置方法3

import urllib3

http = urllib3.PoolManager(timeout=4.0)

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

4.请求重试设置

In [ ]:

#请求重试设置

import urllib3

http = urllib3.PoolManager(timeout=4.0, retries=10)

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

In [ ]:

import urllib3

http = urllib3.PoolManager(timeout=4.0)

head = {'User-Agent': 'Windows NT 6.1; Win64; x64'}

rq = http.request('GET', url='http://www.tipdm.com/tipdm/index.html', headers=head, retries=10)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data)

5.完整实例

In [ ]:

import urllib3

# 发送请求实例

http = urllib3.PoolManager()

# 网址

url='http://www.tipdm.com/tipdm/index.html'

# 请求头

head = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}

# 超时时间

tm = urllib3.Timeout(connect=1.0, read=3.0)

# 重试次数和重定向次数设置并生成请求

rq = http.request('GET', url=url, headers=head, timeout=tm, retries=5, redirect=4)

print('服务器响应码：', rq.status)

print('响应实体：', rq.data.decode('utf-8'))

6.参考文章

无

【创作不易，望点赞收藏，若有疑问，请留言，谢谢】

使用urllib3实现http请求的更多相关文章

禁用 urllib3 的安全请求警告
报错情况: 禁用该警告: import urllib3 urllib3.disable_warnings()
请求库urllib和urllib3
# coding=utf-8 # urllib """ 使用python的urllib库去模拟浏览器请求网页,常用内容如下: urllib.request 发送HTTP请 ...
urllib和urllib3
urllib库 urllib 是一个用来处理网络请求的python标准库,它包含4个模块. urllib.request---请求模块,用于发起网络请求 urllib.parse---解析模块,用于解 ...
urllib3使用指南
对比urllib,用urllib3处理http请求十分方便,可以嵌入web服务后端用于访问其它web实例提供的接口一.安装 pip install urllib3 二.初始化导入urllib3 i ...
python 文件下载
为了演示urllib3的使用,我们这里将会从一个网站下载两个文件.首先,需要导入urllib3库: import urllib3 这两个文件的源url为: url1 = 'http://earthqu ...
【Python爬虫】Requests库的基本使用
Requests库的基本使用阅读目录基本的GET请求带参数的GET请求解析Json 获取二进制数据添加headers 基本的POST请求 response属性文件上传获取cookie 会 ...
使用pyquery是遇到的一个403的问题
在网上爬虫时,本地windows下运行pyquery代码正常,但是在linux下运行时一直报错 403 Forbidden.刚开始的代码如下 from pyquery import PyQuery a ...
BeautifulSoup实例
Beautiful Soup 4.4.0 中文文档:http://beautifulsoup.readthedocs.io/zh_CN/latest/ #coding:utf-8from bs4 im ...
使用Urllib下载图片
urllib下载图片 urllib3下载图片 Urllib下载图片 from urllib import request import re import os # 妹子图首页下载首页的几张 url ...
python爬虫之requests的高级使用
1.requests能上传文件 # 导入requests模块 import requests # 定义一个dict files = {'file': open('D:/360Downloads/1.t ...

随机推荐

【AnaTraf 分享】什么是 AnaTraf？为什么设计 AnaTraf？
网络流量分析与 AnaTraf "2013年,网络流量分析技术(NTA, Network Traffic Analysis)的概念被首次提出,在2016年逐渐兴起.2017年,NTA被Gar ...
Spring源码阅读 ------------------- SpringFrameWork 5.2 +IDEA 部署其他坑位问题(二)
一.地址下jar包无法下载问题报错信息: Could not get resource 'https://plugins.gradle.org/m2/org/asciidoctor/o ...
用pageOffice文档控件实现 office文档在线编辑
第三方文档控件,pageOffice 系统开发中经常要处理办公文档,如果word,excel,ppt,编辑整理,保存,归档. 开发市场上也有很多第三文文档控件,多年的总结,还是认为pageOffice ...
Python：用tqdm模块绘制进度条
在计算密集型迭代计算中,我们常常需要知道当前的迭代轮次,最传统的方法就是打印当前迭代计数器的轮数.那有没有更好的方法呢?我们可以使用tqdm模块(非py内置,需要单独按照)来在控制台绘制进度条,这样更 ...
Kubernetes 数据存储：从理论到实践的全面指南
本文深入解析 Kubernetes (K8S) 数据存储机制,探讨其架构.管理策略及最佳实践.文章详细介绍了 K8S 数据存储的基础.架构组成.存储卷管理技巧,并通过具体案例阐述如何高效.安全地管理数 ...
阿里云日志服务-Logtail配置
配置名称: 日志路径: /www/wwwroot/yf/yyyy/application/storage/ /∗∗/ 指定文件夹下所有符合文件名称的文件都会被监控到(包含所有层次的目录),文件名称可以 ...
【C#】封装的异步HttpRequest
private async void btn_userLogin_Click(object sender, EventArgs e) { UInfo = new ...
linux内核参数调优和Linux实例常用内核网络参数介绍与常见问题处理
问题1 并发场景下,常常会出现一个进程最大文件句柄数不足的情况,会报如下错误: 24: Too many open files 解决办法 ulimit -a S:表示软限制,超出设定的值会告警. H ...
史上最全shell脚本编程语法上册
1. shell 脚本语言的基本用法 1.1 shell 脚本的用途将简单的命令组合完成复杂的工作,自动化执行命令,提高工作效率: 减少手工命令的输入,一定程度上避免人为错误: 将软件或应用的安装及 ...
详解 XSS 攻击原理
更多优质博文请关注:听到微笑的博客跨站脚本攻击(Cross Site Scripting)本来的缩写为CSS,为了与层叠样式表(Cascading Style Sheets,CSS)的缩写进行区分, ...

使用urllib3实现http请求

1.发送请求

2.设置请求头信息

3.防止连接不稳定

4.请求重试设置

5.完整实例

6.参考文章

使用urllib3实现http请求的更多相关文章

随机推荐

热门专题