requests请求库

# coding = utf-8

"""

同urllib一样

requests 也是发送http请求的第三方库 兼容Python2和3

实现了http的绝大部分功能。

安装  pip install requests

"""

# 1.requests发送请求

"""

同直接同requests.get/post来指定发送请求的方式

pycharm环境下，可通过alt+鼠标点击进入源代码，可观察requests的相关参数

"""

# import requests

# 请求百度页面

# response = requests.get('http://www.baidu.com')

# print(response)

# 打印响应内容，也可通过debug来查看response对象里面包含的值

# 请求返回值是一个Response对象，是对HTTP协议中服务端返回给客户端响应数据的封装

# 包括状态码，响应头，响应体

# 显示状态码

# code = response.status_code  # 状态码

# 响应头信息

# for key, value in response.headers.items():

#     print('{}:{}'.format(key, value))

# 响应体

# print(response.content)

# content返回原始数据，字节串，bytes类型，一般图片、音频、视频数据，就用content

# 可通过response.content.decode()解码，默认utf-8解码，将字节串转码为字符串

# print(response.text)

# 返回文本数据， str类型，是经过转码的数据，但是文本中的中文可能出现乱码

# 显示请求网页的编码方式

# print(response.encoding)  # 一般为ISO-8859

# 设置网页编码方式

# response.encoding = 'utf-8'

# 因为网页默认编码为ISO8859，所以显示中文的时候，可能乱码，

# 因此通过以上方法设置编码为utf-8，可解决中文乱码问题

# 2.requests请求url传参

"""

通过对url传参，拼接字符串，因此请求变为http://www.baidu.com/s?wd=python

"""

# import requests

# get请求的传参

# parms = {'wd': 'python'}

# response = requests.get('http://www.baidu.com/s?', parms=parms)

# post请求的传参，此处的url为测试网站

# 同get一样，参数类型也是字典格式

# data = {'key1': 2, 'key3': 3}

# r = requests.post('http://httpbin.org/post', data=data)

# print(r.text)

# 3.requests中的超时设置

# import requests

# 设置超时时间为5秒，若5s内目标地址没有响应，则抛出异常

# requests.get('https://www.google.com', timeout=5)

# 4.request中的cookies处理

"""

通过requests请求目标网站，返回值中自动携带cookies

可通过response.cookies查看

可将返回的cookie保存下来，然后下一次访问时携带上即可

例：

cookie = response.cookies

下次请求时：resquest.get(xxx.xxx, cookies=cookie)即可携带上次访问

页面时返回的cookie信息

"""

# import requests

# params = {'wd':"python"}

# response = requests.get('http://www.baidu.com/s?', params=params)

# print(response.cookies)

#5.requests中的会话--session

"""

http协议是一种无状态协议，无法保持会话状态，因此出现cookies，访问时携带cookie信息，

即可保持上一次会话的信息，requests中返回值中携带cookies信息，但是下次访问时需要

手动传入，依旧不方便，因此出现session，它会自动保存cookies信息，

并在下一次访问中自动传入

访问网页的方式基本和requests相同

"""

# import requests

# 构建一个会话  api基本和requests相同，后面的访问操作都通过该会话进行

# session = requests.session()

# 请求方式和request相同

# session.get('http://www.baidu.com')

#6.requests中的ssl 认证

"""

部分网站请求时需要证书，因此需要对证书进行一定处理

设置verify=False来设定请求网站时不验证证书

同样的，通过设置verify=True设置请求时验证证书

"""

# import requests

# r = requests.get('https://www.jianshu.com', verify=False)

# 7.requests伪装浏览器访问目标网站

"""

部分网站会识别是通过代码请求还是人来请求的，requests中同样提供将请求伪装为

浏览器的接口， 通过headers传参即可

因为知乎在未登录时，会自动跳转到登录页面

通过allow_redirects=False设置不跳转

"""

# import requests

# headers = {

#     'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'

# }

# r = requests.get('http://www.zhihu.com', verify=False,

#                  headers=headers, allow_redirects=False)

#

# 8.requests中的代理设置

# import requests

# 将代理设置为如下格式，参数传入即可

# proxies = {

#     'http': 'http://10.11.12.13:1234',

#     'https': 'http://10.11.12.13:1234',

# }

# requests.get("http://httpbin.org/ip", proxies=proxies)

# 9. json

"""

将json格式数据转成字典格式，前提是目标网站返回值是json格式的

因此该方法用的也很少

"""

# import requests

# url = 'http://www.baidu.com'

# r = requests.get(url)

# print(r.json())

requests请求库的更多相关文章

爬虫（一）—— 请求库（一）requests请求库
目录 requests请求库爬虫:爬取.解析.存储一.请求二.响应三.简单爬虫四.requests高级用法五.session方法(建议使用) 六.selenium模块 requests请求 ...
爬虫之requests请求库
介绍 #介绍:使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) #注意:requests库发送请求将网页内容下 ...
爬虫之requests请求库高级应用
1.SSL Cert Verification #证书验证(大部分网站都是https) import requests respone=requests.get('https://www.12306. ...
requests请求库练习--GitHub登录
# coding = utf-8 """ 结合抓包工具,采用两种方法模拟登录github直接利用session登录和利用requests登录 ""&q ...
Python爬虫requests请求库
requests:pip install request 安装实例: import requestsurl = 'http://www.baidu.com'response = requests. ...
Selenium请求库
阅读目录一介绍二安装三基本使用四等待元素被加载五选择器六元素交互操作七其他八项目练习九破解登录验证一介绍 1.selenium是什么? selenium最初是一 ...
爬虫请求库——requests
请求库,即可以模仿浏览器对网站发起请求的模块(库). requests模块使用requests可以模拟浏览器的请求,requests模块的本质是封装了urllib3模块的功能,比起之前用到的urll ...
Python3 网络爬虫（请求库的安装）
Python3 网络爬虫(请求库的安装) 爬虫可以简单分为几步:抓取页面,分析页面和存储数据在页面爬取的过程中我们需要模拟浏览器向服务器发送请求,所以需要用到一些python库来实现HTTP的请求操 ...
Python浅谈requests三方库
requests 三方库用于获取URL资源 1.GET请求访问一个页面 import requests r = requests.get('https://www.cnblogs.com/xqxacm ...

随机推荐

.Net Core实现健康检查
ASP.NET Core 提供运行状况检查中间件和库,以用于报告应用基础结构组件的运行状况. 运行状况检查由应用程序作为 HTTP 终结点公开. 可以为各种实时监视方案配置运行状况检查终结点: 运行状 ...
使用 Nginx 搭建静态资源 web 服务器
在搭建网站的时候,往往会加载很多的图片,如果都从 Tomcat 服务器来获取静态资源,这样会增加服务器的负载,使得服务器运行速度非常慢,这时可以使用 Nginx 服务器来加载这些静态资源,这样就可以 ...
python argparse：命令行参数解析详解
简介本文介绍的是argparse模块的基本使用方法,尤其详细介绍add_argument内建方法各个参数的使用及其效果. 本文翻译自argparse的官方说明,并加上一些笔者的理解 import a ...
[2018-03-06] 基于Django的轻量级CMS Mezzanine搭建笔记
一丶什么是Mezzanine? 它是基于django的内容管理平台(),组成简单,可扩展性和定制性强,特别是个小型的个人博客系统.它也提供了类似wordpress的管理页面.博客发布.图片展示等功能, ...
安装ubuntu16虚拟机，下载android源码，配置编译环境
Android 源码编译步骤: 我考虑了一下,目前电脑装了SSD,8G内存,使用虚拟机编译源码应该够用. 首先下载虚拟机软件,由于最近一直在使用virtualbox,感觉蛮不错了,下载地址: http ...
「CF52C」Circular RMQ
更好的阅读体验 Portal Portal1: Codeforces Portal2: Luogu Description You are given circular array \(a_0, a_ ...
手把手带你实战下Spring的七种事务传播行为
目录本文目录一.什么是事务传播行为? 二.事务的7种传播行为三.7种传播行为实战本文介绍Spring的七种事务传播行为并通过代码演示下. 本文目录一.什么是事务传播行为? 事务传播行为(pr ...
python经典面试算法题1.1：如何实现链表的逆序
本题目摘自<Python程序员面试算法宝典>,我会每天做一道这本书上的题目,并分享出来,统一放在我博客内,收集在一个分类中. 1.1 如何实现链表的逆序 [腾讯笔试题] 难度系数:⭐⭐⭐ ...
006.Kubernetes二进制部署ETCD
一部署ETCD集群 1.1 安装ETCD etcd 是基于 Raft 的分布式 key-value 存储系统,由 CoreOS 开发,常用于服务发现.共享配置以及并发控制(如 leader 选举.分 ...
深入理解计算机系统第二章信息的表示和处理 Part2 第二遍
<深入理解计算机系统> 第三版第二遍读这本书,每周花两到三小时时间,能读多少读多少(这次看了 29 ~ 34 页) 第一遍对应笔记链接 https://www.cnblogs.com/s ...

requests请求库

requests请求库的更多相关文章

随机推荐

热门专题