php-resque的设计和使用
php-resque-1.2-annotated 一个 php-resque 源码阅读的项目,欢迎大家star
php-resque的设计
在Resque中,一个后台任务被抽象为由三种角色共同完成:
- Job | 任务 : 一个Job就是一个需要在后台完成的任务,比如本文举例的发送邮件,就可以抽象为一个Job。在Resque中一个Job就是一个Class。
- Queue | 队列 : 也就是上文的消息队列,在Resque中,队列则是由Redis实现的。Resque还提供了一个简单的队列管理器,可以实现将Job插入/取出队列等功能。
- Worker | 执行者 : 负责从队列中取出Job并执行,可以以守护进程的方式运行在后台。
那么基于这个划分,一个后台任务在Resque下的基本流程是这样的:
在Resque中,有一个很重要的设计:一个Worker,可以处理一个队列,也可以处理很多个队列,并且可以通过增加Worker的进程/线程数来加快队列的执行速度。
流程如下:
- 将一个后台任务编写为一个独立的Class,这个Class就是一个Job。
- 在需要使用后台程序的地方,系统将Job Class的名称以及所需参数放入队列。
- 以命令行方式开启一个Worker,并通过参数指定Worker所需要处理的队列。
- Worker作为守护进程运行,并且定时检查队列。
- 当队列中有Job时,Worker取出Job并运行,即实例化Job Class并执行Class中的方法。
php-resque的使用
编写一个Worker
其实php-resque已经给出了简单的例子, demo/job.php文件就是一个最简单的Job:
class PHP_Job
{
public function perform()
{
sleep(120);
fwrite(STDOUT, 'Hello!');
}
}
这个Job就是在120秒后向STDOUT输出字符Hello!
在Resque的设计中,一个Job必须存在一个perform方法,Worker则会自动运行这个方法。
将Job插入队列
php-resque也给出了最简单的插入队列实现 demo/queue.php:
if(empty($argv[1])) {
die('Specify the name of a job to add. e.g, php queue.php PHP_Job');
}
require __DIR__ . '/init.php';
date_default_timezone_set('GMT');
Resque::setBackend('127.0.0.1:6379');
$args = array(
'time' => time(),
'array' => array(
'test' => 'test',
),
);
$jobId = Resque::enqueue('default', $argv[1], $args, true);
echo "Queued job ".$jobId."\n\n";
在这个例子中,queue.php需要以cli方式运行,将cli接收到的第一个参数作为Job名称,插入名为'default'的队列,同时向屏幕输出刚才插入队列的Job Id。在终端输入:
cd demo
php queue.php PHP_Job
结果可以看到屏幕上输出:
Queued job 52f5abf5344094efc417e7ea8f1aa083
即Job已经添加成功。注意这里的Job名称与我们编写的Job Class名称保持一致:PHP_Job
在这个时候连接redis-cli,可以看到有如下三个key:
1) "resque:job:52f5abf5344094efc417e7ea8f1aa083:status"
2) "resque:queue:default"
3) "resque:queues"
分别用如下命令查看其类型:
type resque:job:52f5abf5344094efc417e7ea8f1aa083:status
type resque:queue:default
type resque:queues
其类型分别是:string/list/set
取出resque:job:52f5abf5344094efc417e7ea8f1aa083:status的内容查看:
get resque:job:52f5abf5344094efc417e7ea8f1aa083:status
其内容如下:
"{\"status\":1,\"updated\":1438095296,\"started\":1438095296}"
其中的status表示Job运行状态,updated表示更新时间,started表示开始时间。
这里存放的是job执行状态的信息。
php-resque同样也提供了查看Job运行状态的例子,直接运行:
php check_status.php 52f5abf5344094efc417e7ea8f1aa083
可以看到输出为:
Tracking status of 52f5abf5344094efc417e7ea8f1aa083. Press [break] to stop.
Status of 52f5abf5344094efc417e7ea8f1aa083 is: 1
我们刚才创建的Job状态为1。在Resque中,一个Job有以下4种状态:
- Resque_Job_Status::STATUS_WAITING = 1; (等待)
- Resque_Job_Status::STATUS_RUNNING = 2; (正在执行)
- Resque_Job_Status::STATUS_FAILED = 3; (失败)
- Resque_Job_Status::STATUS_COMPLETE = 4; (结束)
取出resque:queue:default的内容查看(key中的default是在之前代码中定义的queue的名称):
lrange resque:queue:default 0 -1
其内容如下:
1) "{\"class\":\"PHP_Job\",\"args\":[{\"time\":1438095296,\"array\":{\"test\":\"test\"}}],\"id\":\"52f5abf5344094efc417e7ea8f1aa083\"}"
其中的class表示Job的类,args表示Job执行时的参数,id表示Job的ID,可以根据这个ID去查询Job执行状态的信息。
这里存放的是每个要执行的Job的相关信息。因为只添加了一个,所以在default的队列中,只有一个值。
取出resque:queues的内容查看:
smembers resque:queues
其内容如下:
1) "default"
这里存放的是所有队列的名称。因为只有一个,所以在queues的集合中,只有一个值。
因为没有Worker运行,所以刚才创建的Job还是等待状态。
运行Worker
这次我们直接编写demo/resque.php:
date_default_timezone_set('GMT');
require 'job.php';
require '../bin/resque';
可以看到一个Worker至少需要两部分:
可以直接包含Job类文件,也可以使用php的自动加载机制,指定好Job Class所在路径并能实现自动加载
包含Resque的默认Worker: bin/resque
在终端中运行:
QUEUE=default php resque.php
前面的QUEUE部分是设置环境变量,我们指定当前的Worker只负责处理default队列。也可以使用
QUEUE=* php resque.php
来处理所有队列。
运行后输出为
#!/usr/bin/env php
*** Starting worker jun-Ubuntu:23437:*
用ps指令检查一下:
ps aux | grep resque
可以看到有一个php的守护进程已经在运行了
jun 23437 1.0 0.3 314148 14884 pts/16 S+ 23:23 0:00 php resque.php
在这个时候再连接到redis-cli,查看key,可以看到如下key:
1) "resque:job:52f5abf5344094efc417e7ea8f1aa083:status"
2) "resque:workers"
3) "resque:queues"
4) "resque:worker:jun-Ubuntu:25122:*:started"
5) "resque:worker:jun-Ubuntu:25122:*"
分别查看新增的key是什么类型:
type resque:workers
type resque:worker:jun-Ubuntu:25122:*:started
type resque:worker:jun-Ubuntu:25122:*
其类型分别是set/string/string
分别取出其内容,命令就不再写了,请参考之前的内容
resque:workers中的内容如下:
1) "jun-Ubuntu:25122:*"
这里存放的是所有worker的进程ID。因为只有一个,所以在workers的集合中,只有一个值。
resque:worker:jun-Ubuntu:25122::started中的内容如下(key中的jun-Ubuntu:25122:是worker的host+进程ID+queue的名称):
"Tue Jul 28 15:29:37 GMT 2015"
这里存放的是Job启动的时间。
resque:worker:jun-Ubuntu:25122:中的内容如下(key中的jun-Ubuntu:25122:是worker的host+进程ID+queue的名称):
"{\"queue\":\"default\",\"run_at\":\"Tue Jul 28 15:29:37 GMT 2015\",\"payload\":{\"class\":\"PHP_Job\",\"args\":[{\"time\":1438097296,\"array\":{\"test\":\"test\"}}],\"id\":\"52f5abf5344094efc417e7ea8f1aa083\"}}"
这里存放的是这个worker当前执行的Job的所有信息。
于此同时,resque:job:52f5abf5344094efc417e7ea8f1aa083:status中的内容变为如下内容:
"{\"status\":2,\"updated\":1438097377}"
状态变为2(正在执行)了。
也可以使用之前的检查Job指令
php check_status.php 52f5abf5344094efc417e7ea8f1aa083
2分钟后再连接到redis-cli上去查看key,可以看到如下key:
1) "resque:job:52f5abf5344094efc417e7ea8f1aa083:status"
2) "resque:workers"
3) "resque:stat:processed"
4) "resque:stat:processed:jun-Ubuntu:25122:*"
5) "resque:queues"
6) "resque:worker:jun-Ubuntu:25122:*:started"
其中的resque:stat:processed和resque:stat:processed:jun-Ubuntu:25122:都是string类型,分别表示所有worker执行job成功的个数和worker为jun-Ubuntu:25122:的执行job成功的个数。
这个时候再去查看以下resque:job:52f5abf5344094efc417e7ea8f1aa083:status的内容,发现状态已经变为4(结束)了。
也可以使用之前的检查Job指令查看,其结果如下:
Status of 52f5abf5344094efc417e7ea8f1aa083 is: 4
这表示任务已经运行完毕,同时屏幕上应该可以看到输出的Hello!
至此我们已经成功的完成了一个最简单的Resque实例的全部演示,更复杂的情况以及遗留的问题会在下一次的日志中说明。
总结一下Redis中的key对应的内容及其含义如下:
- resque:workers (set) - 存放所有的worker,每一个值都是{worker host}:{进程ID}:{queue的名称}
- resque:queues (set) - 存放所有queue的名称
- resque:queue:default (list) - 保存这个队列中等待执行的Job
- resque:job:52f5abf5344094efc417e7ea8f1aa083:status (string) - 存放job的状态信息
- resque:stat:processed (string) - 保存所有worker执行job成功的个数
- resque:stat:processed:jun-Ubuntu:25122:* (string) - 保存一个worker执行job成功的个数
- resque:worker:jun-Ubuntu:25122:*:started (string) - 保存一个worker的启动时间
- resque:worker:jun-Ubuntu:25122:* (string) - 保存一个worker当前执行的Job的所有信息
参考摘录:
PHP的轻量消息队列php-resque使用说明
php-resque的设计和使用的更多相关文章
- PHP的轻量消息队列php-resque使用说明
日志未经声明,均为AlloVince原创.版权采用『 知识共享署名-非商业性使用 2.5 许可协议』进行许可. 消息队列处理后台任务带来的问题 项目中经常会有后台运行任务的需求,比如发送邮件时,因为要 ...
- Redis+php-resque实现消息队列
服务器硬件配置 Dell PowerEdge R310英特尔单路机架式服务器 Intel Xeon Processor X3430 2.4GHz, 8MB Cache 8GB内存(2 x 4GB) ...
- 用PHP实现守护进程任务后台运行与多线程(php-resque使用说明)
消息队列处理后台任务带来的问题 项目中经常会有后台运行任务的需求,比如发送邮件时,因为要连接邮件服务器,往往需要5-10秒甚至更长时间,如果能先给用户一个成功的提示信息,然后在后台慢慢处理发送邮件的操 ...
- php-resque 任务队列
php-resque License : MIT Source Code Allo点评:php-resque是Ruby项目resque在php下的实现.虽然Gearman也是一个不错的选择,但是res ...
- PHP-Resque 简介
转载于:http://blog.hsatac.net/2012/01/php-resque-introduction/ Resque 是 Github 基於 Redis 开发的 background ...
- 两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计(转)
原文:Scaling Pinterest - From 0 To 10s Of Billions Of Page Views A Month In Two Years 译文:两年内从零到每月十亿 PV ...
- 转:Spine.JS+Rails重客户端Web应用技术选型思路:『风车』架构设计
原文来自于:http://www.infoq.com/cn/articles/fengche-co-architecture 风车这个项目开始于 2011 年 11 月份,之前叫做 Pragmatic ...
- 探索Redis设计与实现13:Redis集群机制及一个Redis架构演进实例
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 如何一步一步用DDD设计一个电商网站(九)—— 小心陷入值对象持久化的坑
阅读目录 前言 场景1的思考 场景2的思考 避坑方式 实践 结语 一.前言 在上一篇中(如何一步一步用DDD设计一个电商网站(八)—— 会员价的集成),有一行注释的代码: public interfa ...
随机推荐
- Python 小而美的函数
python提供了一些有趣且实用的函数,如any all zip,这些函数能够大幅简化我们得代码,可以更优雅的处理可迭代的对象,同时使用的时候也得注意一些情况 any any(iterable) ...
- C# ini文件操作【源码下载】
介绍C#如何对ini文件进行读写操作,C#可以通过调用[kernel32.dll]文件中的 WritePrivateProfileString()和GetPrivateProfileString()函 ...
- 网络原因导致 npm 软件包 node-sass / gulp-sass 安装失败的处理办法
如果你正在构建一个基于 gulp 的前端自动化开发环境,那么极有可能会用到 gulp-sass ,由于网络原因你可能会安装失败,因为安装过程中部分细节会到亚马逊云服务器上获取文件.本文主要讨论在不变更 ...
- Scrapy框架爬虫初探——中关村在线手机参数数据爬取
关于Scrapy如何安装部署的文章已经相当多了,但是网上实战的例子还不是很多,近来正好在学习该爬虫框架,就简单写了个Spider Demo来实践.作为硬件数码控,我选择了经常光顾的中关村在线的手机页面 ...
- 理解Maven中的SNAPSHOT版本和正式版本
Maven中建立的依赖管理方式基本已成为Java语言依赖管理的事实标准,Maven的替代者Gradle也基本沿用了Maven的依赖管理机制.在Maven依赖管理中,唯一标识一个依赖项是由该依赖项的三个 ...
- 在Openfire上弄一个简单的推送系统
推送系统 说是推送系统有点大,其实就是一个消息广播功能吧.作用其实也就是由服务端接收到消息然后推送到订阅的客户端. 思路 对于推送最关键的是服务端向客户端发送数据,客户端向服务端订阅自己想要的消息.这 ...
- “不给力啊,老湿!”:RSA加密与破解
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 加密和解密是自古就有技术了.经常看到侦探电影的桥段,勇敢又机智的主角,拿着一长串毫 ...
- C语言 · 整数平均值
编写函数,求包含n个元素的整数数组中元素的平均值.要求在函数内部使用指针操纵数组元素,其中n个整数从键盘输入,输出为其平均值. 样例输入: (输入格式说明:5为输入数据的个数,3 4 0 0 2 是以 ...
- ES6模块import细节
写在前面,目前浏览器对ES6的import支持还不是很好,需要用bable转译. ES6引入外部模块分两种情况: 1.导入外部的变量或函数等: import {firstName, lastName, ...
- 23种设计模式--责任链模式-Chain of Responsibility Pattern
一.责任链模式的介绍 责任链模式用简单点的话来说,将责任一步一步传下去,这就是责任,想到这个我们可以相当击鼓传花,这个是为了方便记忆,另外就是我们在项目中经常用到的审批流程等这一类的场景时我们就可以考 ...