爬虫学习--Requests库详解 Day2

什么是Requests

Requests是用python语言编写，基于urllib，采用Apache2 licensed开源协议的HTTP库，它比urllib更加方便，可以节约我们大量的工作，完全满足HTTP测试需求。
一句话总结：它是Python实现的简单易用的HTTP库

安装Requests  pip install requests

验证没有报错，表示已经成功的安装了

实例引入

 import requests

 response = requests.get('https://www.baidu.com')

 print(type(response))

 print(response.status_code) # 状态码

 print(type(response.text))

 print(response.text) # 响应的内容

 print(response.cookies) # 获取cookie

各种请求方式

 import requests

 print(requests.post('http://httpbin.org/post')) #

 print(requests.put('http://httpbin.org/put'))

 print(requests.delete('http://httpbin.org/delete'))

 print(requests.head('http://httpbin.org/get'))

 print(requests.options('http://httpbin.org/get'))

Requests库请求具体怎么用的
基本GET请求-----------------------------------------------------------------------------------------------------------
基本写法

 import requests

 response = requests.get('http://httpbin.org/get')

 print(response.text) # 请求头啊，请求的IP地址，请求的链接

带参数的GET请求

 import requests

 response = requests.get('http://httpbin.org/get?name=germey&age=22')

 print(response.text)

也可以用字典的形式传参 params

 import requests

 data = {

     'name':'xiaohu',

     'age':''

 }

 response = requests.get('http://httpbin.org/get',params=data)

 print(response.text)

解析json

 import requests

 response = requests.get('http://httpbin.org/get')

 print(type(response.text))

 print(response.json())

 print(type(response.json())) # 它是一个字典的类型

区别用json.loads与直接.json有什么不一样,结果其实是一样的

 import requests

 import json

 response = requests.get('http://httpbin.org/get')

 print(type(response.text))

 print(response.json())

 print(json.loads(response.text)) #区别用json.loads与直接.json有什么不一样,结果其实是一样的

 print(type(response.json())) # 它是一个字典的类型

获取二进制数据

 import requests

 response = requests.get('https://github.com/favicon.ico')

 print(type(response.text),type(response.content))  # .content是二进制内容

 print(response.text)

 print(response.content)

获取到图片把它保存

  import requests

 response = requests.get('https://github.com/favicon.ico')

 with open('favicon','wb') as f:

     f.write(response.content)

     f.close()

 添加headers 如果不加headers 报错500

 import requests

 headers = {

     'User-Agent':'Mozilla/5.0(Macintosh;intel Mac OS X 10_11_4)AppleWebKit/537.36(KHTML,like Gecko)Chrome/52.0.2743.116 Safari/537.36'

 }

 response = requests.get("https://www.zhihu.com/explore",headers=headers)

 print(response.text)

基本POST请求

 import requests

 data = {

     'name':'xiaohu',

     'age':'',

     'job':'IT'

 }

 response = requests.post('http://httpbin.org/post',data=data)

 print(response.text)

 import requests

 data = {

     'name':'xiaohu',

     'age':'',

     'job':'IT'

 }

 headers = {

     'User-Agent':'Mozilla/5.0(Macintosh;intel Mac OS X 10_11_4)AppleWebKit/537.36(KHTML,like Gecko)Chrome/52.0.2743.116 Safari/537.36'

 }

 response = requests.post('http://httpbin.org/post',data=data,headers=headers)

 print(response.json())

响应
response属性

 import requests

 response = requests.get('http://www.jianshu.com')

 print(type(response.status_code),response.status_code) # 状态码

 print(type(response.headers),response.headers) # 请求头

 print(type(response.cookies),response.cookies) #

 print(type(response.url),response.url)

 print(type(response.history),response.history) # 访问的历史记录

高级操作
文件上传

 import requests

 files = {

     'file':open('favicon','rb')

 }

 response = requests.post('http://httpbin.org/post',files=files)

 print(response.text)

获取cookie

 import requests

 response = requests.get('https://www.baidu.com')

 print(response.cookies)

 print(type(response.cookies))

 for key,value in response.cookies.items():

     print(key+'='+value)

会话维持

 import requests

 requests.get('http://httpbin.org/cookies/set/number/1165872335') # 为网站设置一个cookies

 response = requests.get('http://httpbin.org/cookies') # 再用get访问这个cookies

 print(response.text) # 为空，因为这里进行了两次get请求，相当于两个浏览器分别设置cookies和访问cookies,相对独立的

改进

 import requests

 S = requests.Session() # 声明对象

 S.get('http://httpbin.org/cookies/set/number/1165872335') # 实现在同一个浏览器进行设置rookies和访问rookies

 response = S.get('http://httpbin.org/cookies') # 再用get访问这个cookies

 print(response.text) # 此时不为空

证书验证

 import requests

 from requests.packages import urllib3

 urllib3.disable_warnings() # 消除警告信息

 response = requests.get('https://www.12306.cn',verify=False) # verify=False 不需要验证进入，但是有警告

 print(response.status_code)

 import requests

 response = requests.get('https://www.12306.cn',cert=('/path/server.crt','/path/key')) # 指定的证书

 print(response.status_code)

代理设置

 import requests

 import socks5

 proxies = {

     "http":"socks5://127.0.0.1:8080",

     "https":"socks5://127.0.0.1:8080",

 }

 response = requests.get('https://www.taobao.com',proxies=proxies)

 print(response.status_code)

超时设置

 import requests

 from requests.exceptions import ReadTimeout

 try:

     response = requests.get('https://www.httpbin.org/get',timeout = 0.2)

     print(response.status_code)

 except ReadTimeout:

     print("timeout")

认证设置

 import requests

 from requests.auth import HTTPBasicAuth

 r = requests.get('http://127.27.34.24:9001',auth=HTTPBasicAuth('user',''))

 print(r.status_code)

 # 第二种方式

 import requests

 r = requests.get('http://127.27.34.24:9001',auth=('user',''))

 print(r.status_code)

异常处理

import requests

from requests.exceptions import ReadTimeout,HTTPError,RequestException,ConnectionError

try:

    response = requests.get('http://httpbin.org/get',timeout = 0.2)

    print(response.status_code)

except ReadTimeout:

    print('Timeout')

except HTTPError:

    print('Http error')

except ConnectionError:

    print('Connection Error')

except RequestException:

    print('error')

爬虫学习--Requests库详解 Day2的更多相关文章

Python爬虫：requests 库详解，cookie操作与实战
原文第三方库 requests是基于urllib编写的.比urllib库强大,非常适合爬虫的编写. 安装: pip install requests 简单的爬百度首页的例子: response.te ...
Python爬虫系列-Requests库详解
Requests基于urllib,比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求. 实例引入 import requests response = requests.get( ...
Python爬虫系列-Urllib库详解
Urllib库详解 Python内置的Http请求库: * urllib.request 请求模块 * urllib.error 异常处理模块 * urllib.parse url解析模块 * url ...
Python爬虫学习==>第八章：Requests库详解
学习目的: request库比urllib库使用更加简洁,且更方便. 正式步骤 Step1:什么是requests requests是用Python语言编写,基于urllib,采用Apache2 Li ...
python WEB接口自动化测试之requests库详解
由于web接口自动化测试需要用到python的第三方库--requests库,运用requests库可以模拟发送http请求,再结合unittest测试框架,就能完成web接口自动化测试. 所以笔者今 ...
python接口自动化测试之requests库详解
前言说到python发送HTTP请求进行接口自动化测试,脑子里第一个闪过的可能就是requests库了,当然python有很多模块可以发送HTTP请求,包括原生的模块http.client,urll ...
requests库详解 --Python3
本文介绍了requests库的基本使用,希望对大家有所帮助. requests库官方文档:https://2.python-requests.org/en/master/ 一.请求: 1.GET请求 ...
python的requests库详解
快速上手迫不及待了吗?本页内容为如何入门 Requests 提供了很好的指引.其假设你已经安装了 Requests.如果还没有,去安装一节看看吧. 首先,确认一下: Requests 已安装 Req ...
爬虫学习--http请求详解
上篇博客里面写了,爬虫就是发http请求(浏览器里面打开发送的都是http请求),然后获取到response,咱们再从response里面找到想要的数据,存储到本地. 咱们本章就来说一下什么是http ...

随机推荐

分库分表(5) ---SpringBoot + ShardingSphere 实现分库分表
分库分表(5)--- ShardingSphere实现分库分表有关分库分表前面写了四篇博客: 1.分库分表(1) --- 理论 2.分库分表(2) --- ShardingSphere(理论) 3. ...
04-07 scikit-learn库之梯度提升树
目录 scikit-learn库之梯度提升树一.GradietBoostingClassifier 1.1 使用场景 1.2 参数 1.3 属性 1.4 方法二.GradietBoostingCl ...
e课表项目第二次冲刺周期第八天
昨天完成了什么? 昨天,我们组商量讨论了二层界面的设计,添加课程所需要的信息大概有:课程名称.教室.任课教师.上课时间.类型(单周.双周.单双周)以及备注等等.然后,我们通过界面的UI设计,让我们软件 ...
创建SSM项目所需
一.mybatis所需: 1.相关jar包 2.创数据库+Javabean类 3.接口+写SQL的xml映射文件 4.核心配置文件:SqlMapConfig.xml 二.springMVC所需: 1. ...
模块的 __name__
模块的 __name__ 每个模块都有一个名称,而模块中的语句可以找到它们所处的模块的名称.这对于确定模块是独立运行的还是被导入进来运行的这一特定目的来说大为有用.正如先前所提到的,当模块第一次被导入 ...
RF分层封装
1.如何管理用例? (1).在ride工具中分层管理用例(案例层.元素层.流程层),提高效率 (2).偶尔运行下,保证脚本能正常跑动 2.用例分层操作案例层:需要加载流程层.txt资源和Seleni ...
Codeforces1141F_Same Sum Blocks
题意给定一个序列,求最多的不相交区间满足区间和相同. 分析从暴力的角度想,是枚举区间再求和,反过来想,直接记录每个和对应是那些区间,然后排个序求最大不相交即可. 代码 #include <b ...
SpringBoot系列：Spring Boot集成Spring Cache，使用RedisCache
前面的章节,讲解了Spring Boot集成Spring Cache,Spring Cache已经完成了多种Cache的实现,包括EhCache.RedisCache.ConcurrentMapCac ...
Maven安装和在IDEA配置Maven
一.Windows安装Maven 1.下载Maven 这里需要注意:不要去官网下载最新的版本,因为会出现与IDEA不兼容的现象. 这里提供下载地址:https://archive.apache.org ...
shell数组（四）
[root@ipha-dev71- exercise_shell]# cat test.sh #!/bin/bash my_array=(a b c d) echo "第一个元素为:${my ...

爬虫学习--Requests库详解 Day2

爬虫学习--Requests库详解 Day2的更多相关文章

随机推荐

热门专题