Python爬虫之Requests库的基本使用

 import requests

 response = requests.get('http://www.baidu.com/')

 print(type(response))

 print(response.status_code)

 print(type(response.text))

 print(response.text)

 print(response.cookies)

 # 各种请求方式

 import requests

 requests.post('http://httpbin.org/post')

 requests.put('http://httpbin.org/put')

 requests.delete('http://httpbin.org/delete')

 requests.head('http://httpbin.org/get')

 requests.options('http://httpbin.org/get')

 # 基本GET请求

 import requests

 response = requests.get('http://httpbin.org/get')

 print(response.text)

 # 带参数GET请求

 import requests

 response = requests.get('http://httpbin.org/get?name=germey&age=22')

 print(response.text)

 import requests

 data = {

     'name': 'germey',

     'age': 22

 }

 response = requests.get('http://httpbin.org/get', params = data)

 print(response.text)

 # 解析json

 import requests

 import json

 response = requests.get('http://httpbin.org/get')

 print(type(response.text))

 print(response.json())

 print(json.loads(response.text))

 print(type(response.json()))

 # 获取二进制数据

 import requests

 response = requests.get('http://github.com/favicon.ico')

 print(type(response.text), type(response.content))

 print(response.text)

 print(response.content)

 # 保存图片

 import requests

 response = requests.get('http://github.com/favicon.ico')

 with open('1.ico', 'wb') as f:

     f.write(response.content)

     f.close()

 # 添加headers 不添加的话会请求失败的

 import requests

 response = requests.get('http://www.zhihu.com/explore')

 print(response.text)

 import requests

 headers = {

     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'

 }

 response = requests.get('http://zhihu.com/explore', headers = headers)

 print(response.text)

 # 基本的POST请求

 import requests

 data = {'name': 'germey', 'age': 22}

 response = requests.post('http://httpbin.org/post', data = data)

 print(response.text)

 import requests

 data = {'name':'germey', 'age':22}

 headers = {

     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'

 }

 response = requests.post('http://httpbin.org/post', data = data, headers = headers)

 print(response.json())

 # response属性

 import requests

 response = requests.get('http://www.jianshu.com')

 print(type(response.status_code), response.status_code)

 print(type(response.headers), response.headers)

 print(type(response.cookies), response.cookies)

 print(type(response.url), response.url)

 print(type(response.history), response.history)

 # 文件上传

 import requests

 files = {'file':open('1.ico', 'rb')}

 response = requests.post('http://httpbin.org/post', files = files)

 print(response.text)

 # 获取cookie

 import requests

 response = requests.get('http://www.baidu.com')

 print(response.cookies)

 for key, value in response.cookies.items():

     print(key + ' = ' + value)

 # 会话维持 模拟登陆(第一个例子，相当于在两个不同的浏览器请求页面，所以获取不到cookies,所以要用第二个session对象)

 import requests

 requests.get('http://httpbin.org/cookies/set/number/123456789')

 response = requests.get('http://httpbin.org/cookies')

 print(response.text)

 import requests

 s = requests.session()

 s.get('http://httpbin.org/cookies/set/number/123456789')

 response = s.get('http://httpbin.org/cookies')

 print(response.text)

 # 证书验证

 import requests

 response = requests.get('https://www.12306.cn')

 print(response.status_code)

 import requests

 from requests.exceptions import ConnectTimeout, HTTPError, ReadTimeout, RequestException

 from requests.auth import HTTPBasicAuth

 import urllib3

 # 证书验证

 # 消除警告（下面的HTTPS页面的请求如果不进行验证就会报警告）

 urllib3.disable_warnings()

 # verify=False 请求HTTPS页面的时候不进行证书验证，默认为True

 response = requests.get('https://www.12306.cn', verify=False)

 print(response.status_code)

 # 代理设置

 proxies = {

     "http": "http://127.0.0.1:9743",

     "https": "https://127.0.0.1:9743",

 }

 response = requests.get("https://www.taobao.com", proxies = proxies)

 print(response.status_code)

 # 代理有用户名和密码的情况

 proxies = {

     "http": "http://user:password@127.0.0.1:9743/",

 }

 response = requests.get("https://www.taobao.com", proxies = proxies)

 print(response.status_code)

 # socks代理

 proxies = {

     "http": "socks5://127.0.0.1:9742",

     "https": "socks5://127.0.0.1:9742",

 }

 response = requests.get("https://www.taobao.com", proxies = proxies)

 print(response.status_code)

 # 超时设置

 try:

     response = requests.get("http://httpbin.org/get", timeout=0.2)

     print(response.status_code)

 except ConnectTimeout:

     print("timeout!")

 # 认证设置 下面两种方法都可以

 response = requests.get("http://120.27.34.24:9001", auth=HTTPBasicAuth("user", ""))

 print(response.status_code)

 response = requests.get("http://120.27.34.24:9001", auth=("user", ""))

 print(response.status_code)

 # 异常处理

 try:

     response = requests.get("http://httpbin.org/get", timeout=0.2)

     print(response.status_code)

 except ConnectTimeout:

     print("timeout!")

 except RequestException:

     print("RequestException!")

 except HTTPError:

     print("HttpError!")

 except ReadTimeout:

     print("ReadTimeout")

 import requests

 response = requests.get("http://www.baidu.com")

 print(response.cookies)

 print("----------")

 # 把cookie对象转化为字典

 d = requests.utils.dict_from_cookiejar(response.cookies)

 print(d)

 print("----------")

 # 把字典转化为cookie对象

 print(requests.utils.cookiejar_from_dict(d))

 # url解码

 print(requests.utils.unquote("http://tieba.baidu.com/f?kw=%D2%D7%D3%EF%D1%D4&fr=ala0&tpl=5", encoding="gb18030"))

 # url编码

 print(requests.utils.quote("http://tieba.baidu.com/f?kw=%D2%D7%D3%EF%D1%D4&fr=ala0&tpl=5"))

Python爬虫之Requests库的基本使用的更多相关文章

Python爬虫之requests库介绍(一)
一:Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 ...
python爬虫之requests库
在python爬虫中,要想获取url的原网页,就要用到众所周知的强大好用的requests库,在2018年python文档年度总结中,requests库使用率排行第一,接下来就开始简单的使用reque ...
Python爬虫：requests 库详解，cookie操作与实战
原文第三方库 requests是基于urllib编写的.比urllib库强大,非常适合爬虫的编写. 安装: pip install requests 简单的爬百度首页的例子: response.te ...
Python爬虫之requests库的使用
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 "HTTP for ...
【Python爬虫】Requests库的基本使用
Requests库的基本使用阅读目录基本的GET请求带参数的GET请求解析Json 获取二进制数据添加headers 基本的POST请求 response属性文件上传获取cookie 会 ...
python爬虫(1)requests库
在pycharm中安装requests库的一种方法首先找到设置搜索然后安装,蓝色代表已经安装 requests库中的get请求与HTTP协议相对应,requests库也有七种请求方式. 获取ur ...
python爬虫之requests库介绍(二)
一.requests基于cookie操作引言:有些时候,我们在使用爬虫程序去爬取一些用户相关信息的数据(爬取张三“人人网”个人主页数据)时,如果使用之前requests模块常规操作时,往往达不到我们 ...
Python爬虫系列-Requests库详解
Requests基于urllib,比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求. 实例引入 import requests response = requests.get( ...
python下载安装requests库
一.python下载安装requests库 1.到git下载源码zip源码https://github.com/requests/requests 2.解压到python目录下: 3.“win+R”进 ...

随机推荐

ThinkPHP 数据库操作(五) : 存储过程、数据集、分布式数据库
存储过程 5.0支持存储过程,如果我们定义了一个数据库存储过程 sp_query ,可以使用下面的方式调用: $result = Db::query('call sp_query(8)'); 返回的是 ...
TP3.2框架中的字母函数解析
C的使用方法以及注意事项使用方法: 1.读取配置 C('参数名称') 配置参数不区分大小写,存在则设置,否则返回NULL; 因为配置参数是全局有效的,因此C方法可以在任何地方读取任何配置,即使某个 ...
『Tarjan算法无向图的双联通分量』
无向图的双连通分量定义:若一张无向连通图不存在割点,则称它为"点双连通图".若一张无向连通图不存在割边,则称它为"边双连通图". 无向图图的极大点双连通子图被 ...
Solr 12 - 部署SolrCloud中遇到的问题 + 解决方法
目录 1 ZooKeeper管理配置文件的另一种方法 2 Solr服务不能访问 3 部分节点处于"Recovering"或"Gone"状态 4 Solr集群不稳 ...
[MySQL]支持 emoji（字符集问题）
问题的根源主要问题就是在字符集,一般解决这种问题都是靠试验.我实验了一通,得出的结论和大家分享一下(如有错误,还望指正): 数据库的字符集数据库连接的字符集配置方法设置数据库的字符集为utf8 ...
Java基础6：代码块与代码加载顺序
更多内容请关注微信公众号[Java技术江湖] 这是一位阿里 Java 工程师的技术小站,作者黄小斜,专注 Java 相关技术:SSM.SpringBoot.MySQL.分布式.中间件.集群.Linux ...
protobuf、LRU、sigleflight
今天咱一次讲3个吧,赶一下进度,好早点开始聊kubernetes! 从groupcache的项目目录结构看,我们今天要学习groupcachepb.lru.singleflight这3个package ...
[JavaScript] audio在浏览器中自动播放
audio 在浏览器中自动播放 autoplay 属性 autoplay 属性规定一旦音频就绪马上开始播放. 如果设置了该属性,音频将自动播放. 使用 autoplay 属性进行播放 //使用auto ...
haroopad 預覽區樣式
body { color:red; font-family:'Microsoft YaHei'; } html,body{ font-family: "微軟雅黑" !importa ...
谈下WebSocket介绍，与Socket的区别
这个话题应该是面试中出现频率比较高的吧....不管咋样还是有必要深入了解下两者之间的关联.废话不多说,直接入题吧: WebSocket介绍与原理目的:即时通讯,替代轮询网站上的即时通讯是很常见的, ...

Python爬虫之Requests库的基本使用

Python爬虫之Requests库的基本使用的更多相关文章

随机推荐

热门专题