python基础===基于requests模块上的协程【trip】

今天看博客get了一个有趣的模块，叫做 trip #（pip install trip）

兼容2.7版本

基于两大依赖包：TRIP: Tornado & Requests In Pair。

先看一下simple code：

import trip

@trip.coroutine

def main():

    r = yield trip.get('http://www.baidu.com/‘)

    print(r.content)

trip.run(main)

于是又做了一个比较：

import time, functools

import requests,trip

def timeit(fn):

    start_time = time.time()

    fn()

    return time.time() - start_time

url = 'https://www.baidu.com/'

times = 100

def fetch():

    r = [requests.get(url) for i in range(times)]

    return r

@trip.coroutine

def  async_fetch():

    r = yield[trip.get(url) for i in range(times)]

    raise trip.Return(r)

print("[+]Non-trip cost: %ss" % timeit(fetch))

print("[+]Trip cost: %ss" % timeit(functools.partial(trip.run,async_fetch)))

#result
#[+]Non-trip cost: 14.9129998684s
#[+]Trip cost: 1.83399987221s

14.9秒和1.8秒的差距，效果显而易见！

在爬虫中的比较，普通爬虫：

import requests

url = 'http://httpbin.org'

s = requests.Session()

def fetch(times=10):

    s.get('%s/cookies/set?name=value' % url)

    r = [s.get('%s/get' % url) for i in range(times)]

    print r

fetch()

加入trip优化后的：

import trip

url = 'http://httpbin.org'

s = trip.Session()

@trip.coroutine

def fetch(times=10):

    yield s.get('%s/cookies/set?name=value' % url)

    r = yield [s.get('%s/get' % url) for i in range(times)]

    print r

trip.run(fetch)

在原基础上更改不大。

python基础===基于requests模块上的协程【trip】的更多相关文章

python 爬虫基于requests模块发起ajax的post请求
基于requests模块发起ajax的post请求需求:爬取肯德基餐厅查询http://www.kfc.com.cn/kfccda/index.aspx中指定某个城市地点的餐厅数据点击肯德基餐厅查 ...
python 爬虫基于requests模块发起ajax的get请求
基于requests模块发起ajax的get请求需求:爬取豆瓣电影分类排行榜 https://movie.douban.com/中的电影详情数据用抓包工具捉取使用ajax加载页面的请求鼠标往下 ...
Python高手之路【八】python基础之requests模块
1.Requests模块说明 Requests 是使用 Apache2 Licensed 许可证的 HTTP 库.用 Python 编写,真正的为人类着想. Python 标准库中的 urllib2 ...
python 爬虫基于requests模块的get请求
需求:爬取搜狗首页的页面数据 import requests # 1.指定url url = 'https://www.sogou.com/' # 2.发起get请求:get方法会返回请求成功的响应对 ...
python基础之线程、进程、协程
线程线程基础知识一个应用程序,可以多进程.也可以多线程. 一个python脚本,默认是单进程,单线程的. I/O操作(音频.视频.显卡操作),不占用CPU,所以: 对于I/O密集型操作,不会占用C ...
python基础之进程、线程、协程篇
一.多任务(多线程) 多线程特点:(1)线程的并发是利用cpu上下文的切换(是并发,不是并行)(2)多线程执行的顺序是无序的(3)多线程共享全局变量(4)线程是继承在进程里的,没有进程就没有线程(5) ...
【Python之路】第九篇--Python基础之线程、进程和协程
进程与线程之间的关系线程是属于进程的,线程运行在进程空间内,同一进程所产生的线程共享同一内存空间,当进程退出时该进程所产生的线程都会被强制退出并清除.线程可与属于同一进程的其它线程共享进程所拥有的全 ...
python基础整理5——多进程多线程和协程
进程与线程 1.进程我们电脑的应用程序,都是进程,假设我们用的电脑是单核的,cpu同时只能执行一个进程.当程序处于I/O阻塞的时候,CPU如果和程序一起等待,那就太浪费了,cpu会去执行其他的程序, ...
孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块
孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块 (完整学习过程屏幕记录视频地址在文末) 从今天起开始正式学习Python的爬虫. 今天已经初步了解了两个主要的模块: ...

随机推荐

【bzoj3132】上帝造题的七分钟二维树状数组区间修改区间查询
题目描述 “第一分钟,X说,要有矩阵,于是便有了一个里面写满了0的n×m矩阵. 第二分钟,L说,要能修改,于是便有了将左上角为(a,b),右下角为(c,d)的一个矩形区域内的全部数字加上一个值的操作. ...
新浪云部署java web程序注意事项
在新浪云新手指南里有部署java的示例,但是对一个新手来说难免会有一些地方犯错,折腾了好长时间才把自己的java web部署到了新浪云.这里主要写一些我遇到的问题与第一次使用新浪云的朋友分享一下. 首 ...
编译 python 生成静态库 libpython2.7.so
由于我们是C++作驱动的Python开发,驱动需要加上Python静态库libpython2.7.so.libpython2.7.so.1.0.libpython2.7.a.此处我想在python源码 ...
[CF452E]Three strings
题目大意:给你三个字符串$A,B,C$,令$L=min(|A|,|B|,|C|)$,对每个$i\in[1,L]$,求出符合$A_{[a,a+i)}=B_{[b,b+i)}=C_{[c,c+i)}$的三 ...
【Codeforces Round #404 (Div. 2)】题解
A. Anton and Polyhedrons 直接统计+答案就可以了. #include<cstdio> #include<cstring> #include<alg ...
BZOJ4755: [JSOI2016]扭动的回文串——题解
https://www.lydsy.com/JudgeOnline/problem.php?id=4755 JYY有两个长度均为N的字符串A和B. 一个“扭动字符串S(i,j,k)由A中的第i个字符到 ...
BZOJ2555：SubString——题解
https://www.lydsy.com/JudgeOnline/problem.php?id=2555 (1):在当前字符串的后面插入一个字符串 (2):询问字符串s在当前字符串中出现了几次?(作 ...
Json对象转为实体对象
Json对象转为实体对象 1.Bean中申明 trainTypeList: public class TrainTypeQueryParam implements Serializable { pri ...
ICM Technex 2017 and Codeforces Round #400 (Div. 1 + Div. 2, combined) A map B贪心 C思路前缀
A. A Serial Killer time limit per test 2 seconds memory limit per test 256 megabytes input standard ...
mysql的cast（）函数
先来补个知识: decimal的用法: decimal(18,4)总长18位,包括1位小数点和4为小数,也就是说18-1-4=13整数位只有13位decimal(19,1)总长19位,17位整数,1位 ...

python基础===基于requests模块上的协程【trip】

python基础===基于requests模块上的协程【trip】的更多相关文章

随机推荐

热门专题