python的requests初步使用
转自:http://my.oschina.net/yangyanxing/blog/280029
早就听说requests的库的强大,只是还没有接触,今天接触了一下,发现以前使用urllib,urllib2等方法真是太搓了……
这里写些简单的使用初步作为一个记录
一、安装 http://cn.python-requests.org/en/latest/user/install.html#install
二、发送无参数的get请求
| 
 1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
 | 
>>> print r.text{  "args": {},   "headers": {    "Accept": "*/*",     "Accept-Encoding": "gzip, deflate",     "Connection": "close",     "Host": "httpbin.org",     "User-Agent": "python-requests/2.3.0 CPython/2.6.6 Windows/7",     "X-Request-Id": "8a28bbea-55cd-460b-bda3-f3427d66b700"  },   "origin": "124.192.129.84", } | 
三、发送带参数的get请求,将key与value放入一个字典中,通过params参数来传递,其作用相当于urllib.urlencode
| 
 1 
2 
3 
4 
5 
 | 
>>> import requests>>> pqyload = {'q':'杨彦星'}>>> r.url | 
四、发送post请求,通过data参数来传递,
| 
 1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
 | 
>>> payload = {'a':'杨','b':'hello'}>>> print r.text{  "args": {},   "data": "",   "files": {},   "form": {    "a": "\u6768",     "b": "hello"  },   "headers": {    "Accept": "*/*",     "Accept-Encoding": "gzip, deflate",     "Connection": "close",     "Content-Length": "19",     "Content-Type": "application/x-www-form-urlencoded",     "Host": "httpbin.org",     "User-Agent": "python-requests/2.3.0 CPython/2.6.6 Windows/7",     "X-Request-Id": "c81cb937-04b8-4a2d-ba32-04b5c0b3ba98"  },   "json": null,   "origin": "124.192.129.84", }>>> | 
可以看到,post参数已经传到了form里,data不光可以接受字典类型的数据,还可以接受json等格式
| 
 1 
2 
3 
 | 
>>> payload = {'a':'杨','b':'hello'}>>> import json | 
五、发送文件的post类型,这个相当于向网站上传一张图片,文档等操作,这时要使用files参数
| 
 1 
2 
3 
 | 
>>> files = {'file': open('touxiang.png', 'rb')}>>> r = requests.post(url, files=files) | 
5.1 定制headers,使用headers参数来传递
| 
 1 
2 
3 
4 
5 
6 
 | 
>>> import json>>> payload = {'some': 'data'}>>> headers = {'content-type': 'application/json'}>>> r = requests.post(url, data=json.dumps(payload), headers=headers) | 
六、响应内容
6.1 响应状态码
r = requests.get('http://httpbin.org/get')
print r.status_code
6.2 响应头
| 
 1 
2 
 | 
>>> print r.headers{'content-length': '519', 'server': 'gunicorn/18.0', 'connection': 'keep-alive', 'date': 'Sun, 15 Jun 2014 14:19:52 GMT', 'access-control-allow-origin': '*', 'content-type': 'application/json'} | 
也可以取到这个个别的响应头用来做一些判断,这里的参数是不区分大小写的
r.headers[‘Content-Type’]
r.headers.get(‘Content-Type’)
6.3 响应内容,前面已经在应用了
r.text
r.content
七、获取响应中的cookies
| 
 1 
2 
3 
 | 
>>> r.cookies['BAIDUID']'D5810267346AEFB0F25CB0D6D0E043E6:FG=1' | 
也可以自已定义请求的COOKIES
| 
 1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
 | 
>>> cookies = {'cookies_are':'working'}>>> r = requests.get(url,cookies = cookies)>>> >>> print r.text{  "cookies": {    "cookies_are": "working"  }}>>> | 
cookies还有很多,因为目前我也还不是很多,以后再扩充吧
八、使用timeout参数设置超时时间
>>> requests.get('http://github.com', timeout=1) 
<Response [200]>
如果将时间设置成非常小的数,如requests.get('http://github.com', timeout=0.001),那么如果在timeout的时间内没有连接,那么将会抛出一个Timeout的异常
九、访问中使用session
先初始化一个session对象,s = requests.Session() 
然后使用这个session对象来进行访问,r = s.post(url,data = user)
参考文章 http://blog.csdn.net/iloveyin/article/details/21444613 基本上都是从这扒的代码
以下通过访问人人网来获取首页中的最近来访问,然后再访问查看更多的来访来读取更多的最近来访
更多的来访就是以带session的访问http://www.renren.com/myfoot.do
| 
 1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
 | 
#coding:utf-8import requestsimport reuser = {'email':'email','password':'pass'}s = requests.Session()r = s.post(url,data = user)html = r.textvisit = []first = re.compile(r'</span><span class="time-tip first-tip"><span class="tip-content">(.*?)</span>')second = re.compile(r'</span><span class="time-tip"><span class="tip-content">(.*?)</span>')third = re.compile(r'</span><span class="time-tip last-second-tip"><span class="tip-content">(.*?)</span>')last = re.compile(r'</span><span class="time-tip last-tip"><span class="tip-content">(.*?)</span>')visit.extend(first.findall(html))visit.extend(second.findall(html))visit.extend(third.findall(html))visit.extend(last.findall(html))for i in visit:    print iprint '以下是更多的最近来访'fm = re.compile(r'"name":"(.*?)"')visitmore = fm.findall(vm.text)for i in visitmore:    print i | 

python的requests初步使用的更多相关文章
- Python爬虫之使用Fiddler+Postman+Python的requests模块爬取各国国旗
		
介绍 本篇博客将会介绍一个Python爬虫,用来爬取各个国家的国旗,主要的目标是为了展示如何在Python的requests模块中使用POST方法来爬取网页内容. 为了知道POST方法所需要传 ...
 - Python——安装requests第三方库
		
使用pip安装 在cmd下cd到这个目录下C:\Python27\Scripts,然后执行pip install requests 在cmd 命令行执行 E: 进入e盘 cd Python\pr ...
 - 关于Python ,requests的小技巧
		
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/xie_0723/article/details/52790786 关于 Python Request ...
 - Python之Requests的高级用法
		
# 高级用法 本篇文档涵盖了Requests的一些更加高级的特性. ## 会话对象 会话对象让你能够跨请求保持某些参数.它也会在同一个Session实例发出的所有请求之间保持cookies. 会话对象 ...
 - python的requests快速上手、高级用法和身份认证
		
https://blog.csdn.net/qq_25134989/article/details/78800209 快速上手 迫不及待了吗?本页内容为如何入门 Requests 提供了很好的指引.其 ...
 - Python 安装requests和MySQLdb
		
Python 安装requests和MySQLdb 2017年10月02日 0.系统版本 0.1 查看系统版本 [root@localhost ~]# uname -a Linux localhost ...
 - 【转】使用Python的Requests库进行web接口测试
		
原文地址:使用Python的Requests库进行web接口测试 1.Requests简介 Requests 是使用 Apache2 Licensed 许可证的 HTTP 库.用 Python 编写, ...
 - 转来的——python webdriver自动化测试初步印象——转来的
		
python webdriver自动化测试初步印象 以下示例演示启动firefox,浏览google.com,搜索Cheese,等待搜索结果,然后打印出搜索结果页的标题 from selenium i ...
 - Python+Unittest+Requests+PyMysql+HTMLReport  接口自动化框架
		
整体框架使用的是:Python+Unittest+Requests+PyMysql+HTMLReport 多线程并发模式 主要依赖模块 Unittest.Requests.PyMysql.HTMLR ...
 
随机推荐
- 洛谷  P1064 金明的预算方案【DP/01背包-方案数】
			
题目背景 uim神犇拿到了uoi的ra(镭牌)后,立刻拉着基友小A到了一家--餐馆,很低端的那种. uim指着墙上的价目表(太低级了没有菜单),说:"随便点". 题目描述 不过ui ...
 - 第十四届华中科技大学程序设计竞赛 C Professional Manager【并查集删除/虚点】
			
题目描述 It's universally acknowledged that there're innumerable trees in the campus of HUST. Thus a pro ...
 - Codeforces Round #448 (Div. 2) A. Pizza Separation【前缀和/枚举/将圆(披萨)分为连续的两块使其差最小】
			
A. Pizza Separation time limit per test 1 second memory limit per test 256 megabytes input standard ...
 - Bfs【p2385】 青铜莲花池
			
题目描述--->p2385 青铜莲花池 分析 很明显了,题目告诉我们有八个方向,当然优先考虑bfs! 很简单的bfs,重点在于考虑清楚8个方向. 自己刚开始打错了 emmm 给大家上一个图.↓ ...
 - POJ 2549:Subsets(哈希表)
			
[题目链接] http://poj.org/problem?id=2549 [题目大意] 给出一个数集,从中选择四个元素,使得a+b+c=d,最小化d [题解] 我们对a+b建立Hash_table, ...
 - 【noip2017 day2T2】【蚯蚓】巧用队列单调性线性处理
			
(画师当然是武内崇啦) Description 本题中,我们将用符号[c]表示对c向下取整,例如:[3.0」= [3.1」=[3.9」=3.蛐蛐国最近蚯蚓成灾了!隔壁跳蚤国的跳蚤也拿蚯蚓们没办法,蛐蛐 ...
 - Map泛型集合-显示企鹅信息
			
package collection; /** * 宠物类 * @author * */ public class Pet { private String name; private String ...
 - Unity3d之MonoBehavior的各个函数的执行顺序,回调,顺序,次数等
			
Update 当MonoBehaviour启用时,其Update在每一帧被调用.仅调用一次(每帧) LateUpdate 当Behaviour启用时, 每帧调用一次: FixedUpdate 当Mo ...
 - jqgrid postData setGridParam 调用多次时查询条件累加的问题--详情页查询导致的无法在新的页面中查询
			
$("#btn_search").click(function () { url = "/AMEvents/GetGridJson?evtype=1"; var ...
 - linux命令行翻页
			
在linux上面执行命令,若命令太多屏幕显示不完,通过Shift+pageup/pageDown来查看. putty连接linux后执行就不存在这个问题.