最近迷上了gevent所以研究很多gevent相关的东西。

但是我现在不想写相关gevent和greenlet的东西。因为这一块内容实在太多太大太杂,我自己也还没有完全弄明白,所以等我完全搞清楚测试也测试过了之后。我会写一篇比较系统一点的东西来把我最近研究,和测试过的东西都展现出来。

今天先写一个基于gevent开发的requests库,grequests的使用。

为什么会有地方使用到grequests呢?

首先是对io密集型的需求处理。首先我们都知道,如我们去请求一个网站上的数据,正常来说我们会一条一条的跑,例如这样。

import requests

url = 'http://www.baidu.com'
x = request.get(url)
print x

如果是多个网站的请求 我们可能会使用一个循环以此遍历list url对象。

但是这样就会造一个常见的性能问题。例如中间有一个请求卡住了,或者一些情况导致一个请求长时间没有返回,由于我们的同步请求模式,在得到返回之前我们可能会长时间处于一个io阻塞的状态。这样显而易见,如果有100个请求,不管是性能还是效率肯定都是慢得没得说的。

于是我们才会想要用一种并行的思路去解决类似的问题。如果我们同时开启100个请求,那么最差的情况也就等最后返回的那个家伙返回就可以结束所有的请求了。性能提升是n倍,几乎越多请求异步操作的优势也就越明显。但是这里就要注意了,一般我们不会同步开启那么多请求去访问,因为如果我们开启那么多访问去同时命中对方一台服务器(假设是自己的生产服务器)那么会造成非常大的压力,所以这里我们还可以设置map()的参数将size这个决定并行数量的参数设置成你认为合理的并行值即可。

    rs = (grequests.get(u, proxies=proxies) for u in urls)
grequests.map(rs, size=10)

但是要注意一点,由于python里面的全局锁的关系,并不推荐使用多线程这样的伪并行的方式。虽然coroutines也是伪并行的方式(即线性请求,当其中一个请求遇到io等待的时候切换到另外一个coroutines继续运行等到io返回之后再接收信息,避免长时间的等待和阻塞)所以今天介绍的grequests库就可以在python里使用gevent基于coroutines(协程)解决这个问题。

这里演示使用代码,异常简单就可以使你的请求性能提升数倍。

import grequests
import requests
import cProfile urls = [
'http://www.xiachufang.com/downloads/baidu_pip/2016030101.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030102.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030103.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030104.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030105.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030106.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030107.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030108.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030109.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030110.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030111.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030112.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030113.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030114.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030115.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030116.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030117.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030118.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030119.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030120.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030121.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030122.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030123.json',
'http://www.xiachufang.com/downloads/baidu_pip/2016030200.json',
]
def haha(urls):
rs = (grequests.get(u) for u in urls)
return grequests.map(rs) cProfile.run("haha(urls)") def hehe(urls):
hehe = [requests.get(i) for i in urls]
return hehe cProfile.run("hehe(urls)")

下面贴出请求所用时间数据 仅供参考。

使用异步在24个请求的平均耗时测试10次计算 平均花费130毫秒

      2/1    0.000    0.000    0.132    0.132 coventry.py:651(haha)

在使用同步普通的request库请求的情况下 同样测试10次 平均花费900毫秒 如果中途遇到有单个链接不稳或者超时甚至会花费1秒

 2/1    0.000    0.000    1.149    1.149 coventry.py:657(hehe)

总结:

在io密集,等待io时间长的请求量级越大的情况,这样的性能提升越是明显,使用并发或者协程至少提升性能5倍以上我们越是应该使用异步或并行操作来减少io的等待时间。python比较有效和高效的处理方案我觉得非coroutines(协程)莫属了,而相关库最好用的又是gevent,所以非常值得深入研究下去,一探究竟。使用类似操作减少io等待,提升整个业务性能。

refrence:

http://stackoverflow.com/questions/16015749/in-what-way-is-grequests-asynchronous

http://johndangerthornton.blogspot.com/2015/02/grequests-examples.html

http://stackoverflow.com/questions/21978115/using-grequests-to-make-several-thousand-get-requests-to-sourceforge-get-max-r

关于封装了gevent的request grequest库的使用与讨论的更多相关文章

  1. Gevent高并发网络库精解

    进程 线程 协程 异步 并发编程(不是并行)目前有四种方式:多进程.多线程.协程和异步. 多进程编程在python中有类似C的os.fork,更高层封装的有multiprocessing标准库 多线程 ...

  2. Python3使用request/urllib库重定向问题

    禁止自动重定向 python3的urllib.request模块发http请求的时候,如果服务器响应30x会自动跟随重定向,返回的结果是重定向后的最终结果而不是30x的响应结果. request是靠H ...

  3. 简单方便统一封装的傻瓜式GET/POST库AliasNet正式公布~开源喽~

    在进行网页自动化时我们做得最多的工作就是不停的往某个URL GET/POST数据并得到相应的Response,通过分析Response的结果再进行下一步操作,通过网页自动化我们可以做很多工作,比如去某 ...

  4. 3-STM32带你入坑系列(自己封装点亮一个灯的库--Keil)

    2-STM32带你入坑系列(点亮一个灯--Keil) 首先建一个stm32f103x.h的文件,然后 #include "stm32f103x.h" 还记得上一节 现在呢就是做一个 ...

  5. libxl库的介绍,对Excel操作封装得很好的一个库,兼容2007版和多字节字符(最后有破解版下载)

    前段时间忙着毕业论文,终于有时间写博客了. 早些时候老大给我的一个任务需要对excel进行读表操作,研究了一下c++对excel的操作. 对Excel的操作基本有com,ODBC,AD等,其中ODBC ...

  6. 将自己写的组件封装成类似element-ui一样的库,可以cdn引入

    在写好自己的组件之后 第一步 修改目录结构 在根目录下创建package文件夹,用于存放你要封装的组件 第二部 在webpack配置中加入 pages与publicpath同级 pages: { in ...

  7. 封装自己的Common.js工具库

    Code/** * Created by LT on 2013/6/16. * Common.js * 对原生JS对象的扩展 * Object.Array.String.Date.Ajax.Cooki ...

  8. 封装caffe版的deeplab为库供第三方使用

    1.解决deeplab编译问题 http://m.2cto.com/kf/201612/579545.html

  9. Protel封装库

    一.目录下面的一些封装库中,根据元件的不同封装我们将其封装分为二大类:一类是分立元件的封装,一类是集成电路元件的封装 1.分立元件类: 电容:电容分普通电容和贴片电容: 普通电容在Miscellane ...

随机推荐

  1. JavaScript高级程序设计学习(二)之基本概念

    任何语言的核心都必然会描述这门语言基本的工作原理.而描述的内容通常都要涉及这门语 言的语法.操作符.数据类型.内置功能等用于构建复杂解决方案的基本概念.如前所述, ECMA-262通过叫做 ECMAS ...

  2. zabbix学习-如何部署一个agent客户端

    1. 部署一个agent客户端很简单,比如监控服务器本身 yum install zabbix-agent -y 2.配置文件位置: vim /etc/zabbix/zabbix-agendt.con ...

  3. nargin与varargin的用法

    nargin是用来判断输入变量个数的函数,这样就可以针对不同的情况执行不同的功能.通常可以用它来设定一些默认值.如下例所示: 函数文件 examp.m function fout=examp(a,b, ...

  4. java 文件夹的复制

    复制文件夹字节流BufferedInputStream,BufferedOutputStreamFileInputStream,FileOutputStream问题分解(1) 复制一个文件 copyF ...

  5. redis make jemalloc

    zmalloc.h:50:31: error: jemalloc/jemalloc.h: No such file or directoryzmalloc.h:55:2: error: #error ...

  6. LOJ2542 PKUWC2018 随机游走 min-max容斥、树上高斯消元、高维前缀和、期望

    传送门 那么除了D1T3,PKUWC2018就更完了(斗地主这种全场0分的题怎么会做啊) 发现我们要求的是所有点中到达时间的最大值的期望,\(n\)又很小,考虑min-max容斥 那么我们要求从\(x ...

  7. Luogu3164 CQOI2014 和谐矩阵 异或高斯消元

    传送门 题意:给出$N,M$,试构造一个$N \times M$的非全$0$矩阵,其中所有格子都满足:它和它上下左右四个格子的权值之和为偶数.$N , M \leq 40$ 可以依据题目中的条件列出有 ...

  8. 校内模拟赛 旅行(by NiroBC)

    题意: n个点的无向图,Q次操作,每次操作可以连接增加一条边,询问两个点之间有多少条边是必经之路.如果不连通,输出-1. 分析: 首先并查集维护连通性,每次加入一条边后,如果这条边将会连接两个联通块, ...

  9. SQLAlchemy模块的使用教程

    数据库表是一个二维表,包含多行多列.把一个表的内容用Python的数据结构表示出来的话,可以用一个list表示多行,list的每一个元素是tuple,表示一行记录,比如,包含id和name的user表 ...

  10. CSharp 案例:用 Dynamic 来解决 DataTable 数值累加问题

    需求说明 给定一个 DataTable,如果从中取出数值类型列的值并对其累加? 限制:不知该列是何种数值类型. 解决方案 1.将表转换为 IEnumerable<dynamic>,而后获取 ...