beanstalkd 消息队列

概况：
Beanstalkd，一个高性能、轻量级的分布式内存队列系统，最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟，支持过有9.5 million用户的Facebook Causes应用。后来开源，现在有PostRank大规模部署和使用，每天处理百万级任务。Beanstalkd是典型的类Memcached设计，协议和使用方式都是同样的风格，所以使用过memcached的用户会觉得Beanstalkd似曾相识。

beanstalk核心概念：

job:一个需要异步处理的任务，需要放在一个tube中。
tube:一个有名的任务队列，用来存储统一类型的job
producer:job的生产者
consumer:job的消费者

简单来说流程就一句话：
由 producer 产生一个任务 job ，并将 job 推进到一个 tube 中，
然后由 consumer 从 tube 中取出 job 执行（当然了，这一切的操作的前提是beanstalk服务正在运行中）。

一个job有READY（时刻准备着被消费者取出）, RESERVED（任务正在被一个消费者处理中）, DELAYED（延迟任务，设定的延迟时间后进入ready状态）, BURIED（休眠中，需要转移状态后才能操作）四种状态。当producer直接put一个job时，job就处于READY状态，等待consumer来处理，如果选择延迟put，job就先到DELAYED状态，等待时间过后才迁移到READY状态。consumer获取了当前READY的job后，该job的状态就迁移到RESERVED，这样其他的consumer就不能再操作该job。当consumer完成该job后，可以选择delete, release或者bury操作;delete之后，job从系统消亡，之后不能再获取;release操作可以重新把该job状态迁移回READY(也可以延迟该状态迁移操作)，使其他的consumer可以继续获取和执行该job;有意思的是bury操作，可以把该job休眠，等到需要的时候，再将休眠的job kick回READY状态，也可以delete BURIED状态的job。正是有这些有趣的操作和状态，才可以基于此做出很多意思的应用，比如要实现一个循环队列，就可以将RESERVED状态的job休眠掉，等没有READY状态的job时再将BURIED状态的job一次性kick回READY状态。

beanstalkd拥有的一些特性：
++   producer产生的任务可以给他分配一个优先级，支持0到2**32的优先级，值越小，优先级越高，默认优先级为1024。
   优先级高的会被消费者首先执行
++   持久化，可以通过binlog将job及其状态记录到文件里面，在Beanstalkd下次启动时可以
   通过读取binlog来恢复之前的job及状态。
++   分布式容错，分布式设计和Memcached类似，beanstalkd各个server之间并不知道彼此的存在，
   都是通过client来实现分布式以及根据tube名称去特定server获取job。
++   超时控制，为了防止某个consumer长时间占用任务但不能处理的情况，
   Beanstalkd为reserve操作设置了timeout时间，如果该consumer不能在指定时间内完成job，
   job将被迁移回READY状态，供其他consumer执行。

枯燥的文字介绍结束，举个例子看看如何在实际项目中应用

如果你有疑问为什么要用消息队列，请跳到文末【使用消息队列的10个理由】

这里还是要提醒一句：
消息队列有很多用途，也在很多大型网站中有不同程度的使用，使用灵活，能解决很多
问题，但是！在灵活的背后也是有很多潜在代价的，比如队列意外挂掉，系统维护难度增大，滥用队列导致
系统性能下降等。所以，请确保你的业务逻辑适合使用消息队列，并且你能处理好意外情况。

测试环境（ Ubuntu Server 14.04 + PHP5.5 + Beanstalk V1.10 ）

例子分析：微博是一个很典型的例子：
1，发一个微博
2，推送给他的粉丝（如果有100w个粉丝，这个地方会堵塞很久，用户感受到的就是延迟）
在微博上发布一条内容要做上面两件事情才算完整，发一条微博只需要进行一次简单的数据库操作，
但是推送给他的粉丝却要操作100w次数据库，导致用户发一个微博要等待很长的延迟才能返回结果发送成功。

采用队列的方式，用户发送一条微博立马返回结果，发送成功，剩下的推送就放到队列里面异步执行，
推送并不需要特别及时，延迟过几秒几十秒都是可以接受的。

下面用代码来实现上面的思路：

首先在ubuntu上安装beanstalkd服务，
apt-get install beanstalkd
（官网地址：http://kr.github.io/beanstalkd/download.html）
运行beanstalk /etc/init.d/beanstalkd start
如果启动失败，在 /etc/default/beanstalkd 中添加 START=yes

需要三个文件:
a.php (任务生产者)
b.php (任务消费者)
beanstalk.php (beanstalkd的php客户端，这里选的是 https://github.com/davidpersson/beanstalk)
beanstalk支持的客户端下载：
https://github.com/kr/beanstalkd/wiki/client-libraries

// a.php

// 伪代码如下：

//

require_once "beanstalk.php";

//接受参数

$user  = $_POST['uid'];  //发微博的用户

$content = $_POST['content'];  //发送内容

// 插入微博

// 取出当前插入微博的id => wid

// 查找出用户的所有粉丝uid => fensi

// 把推送放进队列

newtask($wid,$fensi);

function newtask($wid,$fensi)

{

    $beanstalk = new Client();

    $beanstalk->connect();

    $beanstalk->useTube('test');

    foreach ($fensi as $key => $value) {

        //参数说明  优先级  延迟执行  执行超时  任务字符串

        $task = $value . "#" . $wid;   //  粉丝id和微博id

        $beanstalk->put( 1024,  0,   60,   $task );

    }

    $beanstalk->disconnect();

}

//b.php

// 伪代码如下：

//

require_once "beanstalk.php";

$beanstalk = new Client();

$beanstalk->connect();

$beanstalk->watch('test');

while(true)

{

    $job = $beanstalk->reserve(0); 

    if( !$job ) {

        // 这个地方一定要休眠  如果不休眠 while循环会导致cpu跑满

        sleep(1);

        continue;

    }

    $result = $job['body'];

    $pos = explode("#", $result);

    $weibo = $pos[1];

    $uid = $pos[0];

    // 插入粉丝推送数据

    // .................

    // .................

    $beanstalk->delete($job['id']);

}

$beanstalk->disconnect();

beanstalk.php 在这里： https://github.com/davidpersson/beanstalk

使用消息队列的10个理由：

1. 解耦
在项目启动之初来预测将来项目会碰到什么需求，是极其困难的。消息队列在处理过程中间插入了一个隐含的、基于数据的接口层，两边的处理过程都要实现这一接口。这允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。
2. 冗余
有时在处理数据的时候处理过程会失败。除非数据被持久化，否则将永远丢失。消息队列把数据进行持久化直到它们已经被完全处理，通过这一方式规避了数据丢失风险。在被许多消息队列所采用的"插入-获取-删除"范式中，在把一个消息从队列中删除之前，需要你的处理过程明确的指出该消息已经被处理完毕，确保你的数据被安全的保存直到你使用完毕。
3. 扩展性
因为消息队列解耦了你的处理过程，所以增大消息入队和处理的频率是很容易的；只要另外增加处理过程即可。不需要改变代码、不需要调节参数。扩展就像调大电力按钮一样简单。
4. 灵活性 & 峰值处理能力
当你的应用上了Hacker News的首页，你将发现访问流量攀升到一个不同寻常的水平。在访问量剧增的情况下，你的应用仍然需要继续发挥作用，但是这样的突发流量并不常见；如果为以能处理这类峰值访问为标准来投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住增长的访问压力，而不是因为超出负荷的请求而完全崩溃。请查看我们关于峰值处理能力的博客文章了解更多此方面的信息。
5. 可恢复性
当体系的一部分组件失效，不会影响到整个系统。消息队列降低了进程间的耦合度，所以即使一个处理消息的进程挂掉，加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别。
6. 送达保证
消息队列提供的冗余机制保证了消息能被实际的处理，只要一个进程读取了该队列即可。在此基础上，IronMQ提供了一个"只送达一次"保证。无论有多少进程在从队列中领取数据，每一个消息只能被处理一次。这之所以成为可能，是因为获取一个消息只是"预定"了这个消息，暂时把它移出了队列。除非客户端明确的表示已经处理完了这个消息，否则这个消息会被放回队列中去，在一段可配置的时间之后可再次被处理。
7.排序保证
在许多情况下，数据处理的顺序都很重要。消息队列本来就是排序的，并且能保证数据会按照特定的顺序来处理。IronMO保证消息浆糊通过FIFO（先进先出）的顺序来处理，因此消息在队列中的位置就是从队列中检索他们的位置。
8.缓冲
在任何重要的系统中，都会有需要不同的处理时间的元素。例如,加载一张图片比应用过滤器花费更少的时间。消息队列通过一个缓冲层来帮助任务最高效率的执行--写入队列的处理会尽可能的快速，而不受从队列读的预备处理的约束。该缓冲有助于控制和优化数据流经过系统的速度。
9. 理解数据流
在一个分布式系统里，要得到一个关于用户操作会用多长时间及其原因的总体印象，是个巨大的挑战。消息系列通过消息被处理的频率，来方便的辅助确定那些表现不佳的处理过程或领域，这些地方的数据流都不够优化。
10. 异步通信
很多时候，你不想也不需要立即处理消息。消息队列提供了异步处理机制，允许你把一个消息放入队列，但并不立即处理它。你想向队列中放入多少消息就放多少，然后在你乐意的时候再去处理它们。

补充一个：多语言通信，比如用php生产一个job，用python或者其他语言作为消费者来处理

beanstalkd 消息队列的更多相关文章

Beanstalkd消息队列 -- php类Pheanstalk使用
业务场景商城订单生成30分钟后如果未支付关闭订单解决办法可以使用延迟消息队列这里我们用的是beanstalkd Beanstalkd介绍 Beanstalk,一个高性能.轻量级的分布式内 ...
【Beanstalkd】Beanstalkd消息队列的安装与使用
一.Beanstalkd是什么? Beanstalkd是一个高性能,轻量级的分布式内存队列二.Beanstalkd特性 1.支持优先级(支持任务插队)2.延迟(实现定时任务)3.持久化(定时把内存中 ...
beanstalkd 消息队列发邮件
放入消息 /** * 获取beanstalk实例 * * @staticvar resource|bool $beanstalk * @return resource */ function get_ ...
Beanstalkd消息队列的安装与使用
一.Beanstalkd是什么? Beanstalkd是一个高性能,轻量级的分布式内存队列二.Beanstalkd特性 1.支持优先级(支持任务插队)2.延迟(实现定时任务)3.持久化(定时把内存中 ...
php 使用beanstalk 消息队列
Beanstalkd 消息队列一.基本信息Beanstalkd,一个高性能.轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有 ...
Beanstalk消息队列的实现
在工作中要用到消息队列,但是主管为了追求开发速度,让用了一个简易的类 beanstalk 下面来说明这个东西参考博客:https://my.oschina.net/u/698121/blog/15 ...
【消息队列MQ】各类MQ比较
目录(?)[-] RabbitMQ Redis ZeroMQ ActiveMQ JafkaKafka 目前业界有很多MQ产品,我们作如下对比: RabbitMQ 是使用Erlang编写的一个开源的消息 ...
看大数据时代下的IT架构（1）业界消息队列对比
一.MQ(Message Queue) 即消息队列,一般用于应用系统解耦.消息异步分发,能够提高系统吞吐量.MQ的产品有很多,有开源的,也有闭源,比如ZeroMQ.RabbitMQ. ActiveM ...
PHP memcache实现消息队列实例
现在,memcache于server缓存广泛应用.下面我来介绍一下memcache消息队列中等待的样本实现,有需要了解的朋友可以参考. memche消息队列原则key上做文章.后消息或者日志. 然后通 ...

随机推荐

[示例] Firemonkey TGridLayout & TGridPanelLayout 布局
说明:使用 TGridLayout & TGridPanelLayout 来布局源码下载:[示例]TestGridPanelLayout_布局_20161223.zip 展示:
ASP.NET MVC搭建项目后台UI框架—11、自动加载下拉框查询
ASP.NET MVC搭建项目后台UI框架—1.后台主框架需求:在查询记录的时候,输入第一个字,就自动把以这个字开头的相关记录查找出来,输入2个字就过滤以这两个子开头的记录,依次类推. 突然要用到这 ...
xinetd cpu 100%
今天,有个给客户试用的环境出现xinetd cpu 100%,而且连续运行很长时间了.之前也有环境发生过,今天排查解决了三四个问题,实在是查的身体都不舒服了,还没时间查这个问题... 知道的求解...
深入理解DOM节点类型第五篇——元素节点Element
× 目录 [1]特征 [2]子节点 [3]特性操作[4]attributes 前面的话元素节点Element非常常用,是DOM文档树的主要节点:元素节点是html标签元素的DOM化结果.元素节点主要 ...
3D坦克大战游戏源码
3D坦克大战游戏源码,该游戏是基于xcode 4.3,ios sdk 5.1开发.在xcode4.3.3上完美无报错.兼容ios4.3-ios6.0 ,一款ios平台上难得的3D坦克大战游戏源码,有2 ...
常见排序算法(附java代码)
常见排序算法与java实现一.选择排序(SelectSort) 基本原理:对于给定的一组记录,经过第一轮比较后得到最小的记录,然后将该记录与第一个记录的位置进行交换:接着对不包括第一个记录以外的其他 ...
yii2组件之多图上传插件FileInput的详细使用
作者:白狼出处:http://www.manks.top/yii2_multiply_images.html 本文版权归作者,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连 ...
pscp工具上传或取回文件、文件夹
1.把服务器上的/root/dir目录取回本地"C:\My Documents\data\"目录 C:\>pscp.exe -r root@IP:/root/dir &quo ...
不重新编译php安装配置eAccelerator
eAccelerator属于一个免费的开源php加速.优化.编译和动态缓存项目,原理和apc类似,都是通过缓存php编译后的opcode代码来提高php脚本的执行性能,而且eAccelerator本身 ...
VS2015 出现 .NETSystem.Runtime.Remoting.RemotingException: TCP 错误
错误内容: 界面显示内容为: .NET��System.Runtime.Remoting.RemotingException: TCP 淇￠亾鍗忚鍐茬獊: 搴斾负鎶ュご銆� 鍦 ...

beanstalkd 消息队列

beanstalkd 消息队列的更多相关文章

随机推荐

热门专题