(一)使用twisted Deferred
一、开篇
为什么是twisted,twisted作为一个python网络编程框架,出道早,但一直不温不火,这几年和tornado比起来,更是近乎销声匿迹;但作为初学者,觉得twisted还是有很多优点值得去学习的,其优秀的性能(对python框架)其实更适合做底层的tcp server,而且个人觉得twisted deferred的设计思路非常简单清晰,相较于tornado future异步更好理解,缺点可能就是源码不好读,然后如果拿来直接开发web不是很方便。但还是那句话,twisted flask tornado gevent都有自己比较鲜明的特征,值得去学习下。
博主也是初学,写这个博客也是想作为一个学习记录,如果有问题大家可以一起探讨,有出错的地方还请指出,谢谢。
二、认识Deferred
Deferred是一个延迟加载对象,这个概念类似于tornado future,是调用异步操作返回的一个对象,其中包括了操作成功后的回调处理,错误后的回调处理。
简单讲,当我们需要执行一个耗时操作,比如下载某个大图片,此时用twisted的异步http请求,会给我们返回一个Deferred对象,让我们可以不用在这等图片下载完成,当前线程不会阻塞,而是可以去处理别的逻辑。twisted有一个底层event loop(类似tornado ioloop)处理线程),等图片下载完成后,会去自动触发Deferred的回调操作,这个细节我们不需要操作,我们要做的,就是添加这个回调逻辑,也就是常说的注册回调。
下面有个简单例子
# coding:utf-8
import time
from twisted.internet import defer, reactor
class deferTester():
def __init__(self):
self.d = defer.Deferred()
def getDefer(self):
return self.d
#模拟耗时操作
def work(self):
print "[%s] 模拟耗时网络IO, 等待3秒" % nowtime()
time.sleep(3)
self.d.callback('over') # 因为是模拟的IO,任务完成后手动触发回调
#处理成功回调
def handle_success(self,d):
print "[%s] 成功, 接收参数 = " % nowtime(), d
a = [1, 2, 3][4] # 这里会抛异常,添加到defered的errback链,然后由handle_error处理
#处理异常回调
def handle_error(self,d):
print "[%s] 出错了" % nowtime(), repr(d)
def stop():
reactor.stop()
print "[%s] 停止reactor"%nowtime()
def nowtime():
return time.strftime('%Y-%m-%d,%X', time.localtime())
if __name__ == '__main__':
print "[%s] 开始测试 "%nowtime()
tester = deferTester()
d = tester.getDefer() #拿到defered对象
reactor.callWhenRunning(tester.work)#reactor调用耗时任务
d.addCallback(tester.handle_success)
d.addErrback(tester.handle_error)#defered对象添加处理的回调
print "[%s] 启动reactor "%nowtime()
reactor.callLater(5, stop) #5秒后停止reactor线程
reactor.run()
例子很简单,看下注释就清楚了,运行结果为
[2018-10-25,16:10:38] 开始测试
[2018-10-25,16:10:38] 启动reactor
[2018-10-25,16:10:38] 模拟耗时网络IO, 等待3秒
[2018-10-25,16:10:41] 成功, 接收参数 = over
[2018-10-25,16:10:41] 出错了 <twisted.python.failure.Failure exceptions.IndexError: list index out of range>
[2018-10-25,16:10:43] 停止reactor
有几点要注意下:
1. 正常情况下,我们调用twisted的异步http client,会返回一个deferred对象,然后IO完成后,会自动触发deferred对象的事件,但我们这个例子只是简单的用time.sleep()模拟了下耗时操作,所以操作完成后,需要手动callback()去触发成功回调,实际编程中一般是不需要我们自己去触发的。
2. deferred有两条回调链,分别是callback和errback,其中errback也非常重要,因为我们业务不可能次次都调用成功,添加异常处理是必需的!我们不需要再异步中去try except捕捉异常,只需要在上层调用中添加一个回调就可以,因为比如在N层回调中出现了异常,错误信息会记录在errback链中,在N-1层逻辑添加回调就可以了。
如上面的例子,work操作完成后 ---> 触发handle_success回调,但是在handle_success里出现了错误,这个错误会自动以Failure对象记录到errback链中,我们只需要注册一个errback的处理逻辑就可以了,如handle_error,它接受的参数就是Failure对象。
(一)使用twisted Deferred的更多相关文章
- [Twisted] deferred
Twisted提供一个优雅的实现(Deferred)来管理回调函数. Deferred Object 的结构 Deferred Object包含两个回调函数列表.一个用来保存成功的回调函数,另一个用来 ...
- 爬虫基础(五)-----scrapy框架简介
---------------------------------------------------摆脱穷人思维 <五> :拓展自己的视野,适当做一些眼前''无用''的事情,防止进入只关 ...
- 5、爬虫系列之scrapy框架
一 scrapy框架简介 1 介绍 (1) 什么是Scrapy? Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍.所谓的框架就是一个已经被集成了各种功能(高性能 ...
- python 全栈开发,Day137(爬虫系列之第4章-scrapy框架)
一.scrapy框架简介 1. 介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速.简单.可扩展的方式从网站中提取所需的数据.但目前S ...
- 四: scrapy爬虫框架
5.爬虫系列之scrapy框架 一 scrapy框架简介 1 介绍 (1) 什么是Scrapy? Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍.所谓的框架 ...
- 笔记-scrapy-pipeline
笔记-scrapy-pipeline 1.简介 scrapy抓取数据后,使用yield发送item对象至pipeline,pipeline顺序对item进行处理. 一般用于: 清洗,验证,检查数据: ...
- scrapy框架之Pipeline管道类
Item Pipeline简介 Item管道的主要责任是负责处理有蜘蛛从网页中抽取的Item,他的主要任务是清洗.验证和存储数据.当页面被蜘蛛解析后,将被发送到Item管道,并经过几个特定的次序处理数 ...
- 如何用item pipeline(管道)清洗数据
版权声明:本文为博主原创文章,转载请注明出处:如果博客中有错误之处抑或有可以改进的地方,欢迎在评论区留言. https://blog.csdn.net/f156207495/article/detai ...
- 小白学 Python 爬虫(38):爬虫框架 Scrapy 入门基础(六) Item Pipeline
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前置准备(一)基本类库的安装 小白学 Python 爬虫(3):前置准备(二)Li ...
随机推荐
- Visio:为什么按下方向键,选中的目标不动,绘图区(页面)却在移动
造冰箱的大熊猫,本文适用于Microsoft Visio 2007@cnblogs 2018/12/12 检查下键盘的“Scroll Lock”键是不是被激活了(键盘上对应的指示灯被点亮).Scrol ...
- 7.9T2EASY(easy)
EASY(easy) sol:非常经典的题,取了一次之后,把线段树上这一段变成相反数 然后再贪心取和最大的. 重复以上操作,发现最后一定有对应的解,且根据贪心过程一定 是最大的 线段树上维护区间和最大 ...
- clone的fork与pthread_create创建线程有何不同&pthread多线程编程的学习小结(转)
进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合,这些资源在Linux中被抽 象成各种数据对象:进程控制块.虚存空间.文件系统,文件I/O.信号处理函数.所以创建一个进程的 过程就是这 ...
- (70)一篇文章带你熟悉 TCP/IP 协议
作者:涤生_Woo链接:http://www.jianshu.com/p/9f3e879a4c9c來源:简书著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 同样的,本文篇幅也比较 ...
- selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element is not attached to the page document
抓取网页代码后,由于是在同一个li标签下,所以使用一次性抓取,所有的a标签,然后循环做不同的操作,但是抛出找不到元素异常. def office_page(_chrome: Chrome): sn = ...
- 【java】获取项目资源路径
目资源路径分两种,一种是普通Java项目的资源路径,另一种是JavaEE项目的资源路径. 获取Java项目的包(源码下的包 或者 jar包)的资源路径 // 方法1:通过this.getClass() ...
- javascript中“use strict”的好处和坏处
1.为什么使用严格模式? 消除javascript语法的一些不合理.不严谨之处,减少一些怪异行为: 消除代码运行的不安全之处,保证代码的运行: 提高编译效率,增加运行效率: 为未来新版本的javasc ...
- Mysql general_log 日志详解
开启 general log 将所有到达MySQL Server的SQL语句记录下来. 一般不会开启开功能,因为log的量会非常庞大.但个别情况下可能会临时的开一会儿general log以供排障使 ...
- JS判定数据类型
1.typeof 我们能够使用typeof判断变量的身份,判断字符串得到string,数字和NaN得到number,函数会得到function等,但是判断数组,对象和nu ...
- SAP Query创建
一.SAP Query创建步骤 1.创建User Group User Group即用户组,可以将所创建的列表使用权限分配给具体用户,Tcode:SQ03 在使用者群組初始界面里输入自定义名称,单击[ ...