【转】Beanstalkd 队列简易使用

Beanstalkd一个高性能分布式内存队列系统

之前在微博上调查过大家正在使用的分布式内存队列系统，反馈有Memcacheq,Fqueue, RabbitMQ, Beanstalkd以及linkedin的kafka。RabbitMQ使用比较广泛，Beanstalkd是后起之秀。Beanstalkd之于RabbitMQ，就好比Nginx之于Apache，Varnish之于Squid。后面在项目中使用Beanstalkd的过程中，更发现其简单、轻量级、高性能、易使用等特点，以及优先级、多队列、持久化、分布式容错、超时控制等特性。下面就简单介绍一下Beanstalkd，不足之处请大家指正。

设计思想

高性能离不开异步，异步离不开队列，而其内部都是Producer-Comsumer模式的原理。

图1 Producer-Comsumer模式

应用

Beanstalkd，一个高性能、轻量级的分布式内存队列系统，最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟，支持过有9.5 million用户的Facebook Causes应用。后来开源，现在有PostRank大规模部署和使用，每天处理百万级任务。Beanstalkd是典型的类Memcached设计，协议和使用方式都是同样的风格，所以使用过memcached的用户会觉得Beanstalkd似曾相识。

核心概念

Beanstalkd设计里面的核心概念：

◆ job

一个需要异步处理的任务，是Beanstalkd中的基本单元，需要放在一个tube中。

◆ tube

一个有名的任务队列，用来存储统一类型的job，是producer和consumer操作的对象。

◆ producer

Job的生产者，通过put命令来将一个job放到一个tube中。

◆ consumer

Job的消费者，通过reserve/release/bury/delete命令来获取job或改变job的状态。

Beanstalkd中一个job的生命周期如图2所示。一个job有READY, RESERVED, DELAYED, BURIED四种状态。当producer直接put一个job时，job就处于READY状态，等待consumer来处理，如果选择延迟put，job就先到DELAYED状态，等待时间过后才迁移到READY状态。consumer获取了当前READY的job后，该job的状态就迁移到RESERVED，这样其他的consumer就不能再操作该job。当consumer完成该job后，可以选择delete, release或者bury操作;delete之后，job从系统消亡，之后不能再获取;release操作可以重新把该job状态迁移回READY(也可以延迟该状态迁移操作)，使其他的consumer可以继续获取和执行该job;有意思的是bury操作，可以把该job休眠，等到需要的时候，再将休眠的job kick回READY状态，也可以delete BURIED状态的job。正是有这些有趣的操作和状态，才可以基于此做出很多意思的应用，比如要实现一个循环队列，就可以将RESERVED状态的job休眠掉，等没有READY状态的job时再将BURIED状态的job一次性kick回READY状态。

图2 Beanstalkd中job的生命周期

特性

Beanstalkd基于的源码安装和使用很简单，在此略过。这里重点介绍一下其几个很nice的特性。

◆ 优先级

支持0到2**32的优先级，值越小，优先级越高，默认优先级为1024。

◆ 持久化

可以通过binlog将job及其状态记录到文件里面，在Beanstalkd下次启动时可以通过读取binlog来恢复之前的job及状态。

◆ 分布式容错

分布式设计和Memcached类似，beanstalkd各个server之间并不知道彼此的存在，都是通过client来实现分布式以及根据tube名称去特定server获取job。

◆ 超时控制

为了防止某个consumer长时间占用任务但不能处理的情况，Beanstalkd为reserve操作设置了timeout时间，如果该consumer不能在指定时间内完成job，job将被迁移回READY状态，供其他consumer执行。

不足

在使用中发现一个Beanstalkd尚无提供删除一个tube的操作，只能将tube的job依次删除，并让Beanstalkd来自动删除空tube。还有就是Beanstalkd不支持客户端认证机制(开发者将应用场景定位在局域网)。

后续工作

1.介绍Beanstalkd的命令和使用

2. 翻译Beanstalkd协议

3. 分析Beanstalkd源码

原文：http://rdc.taobao.com/blog/cs/?p=1201

最近在做一个项目，需要用户在提交相关信息后，分析信息内容，然后将分析结果推送到相关的用户的信息模块中，用到了beanstalk这个队列系统。

beanstalkd介绍：

Beanstalkd设计里面的核心概念：

◆ job

一个需要异步处理的任务，是Beanstalkd中的基本单元，需要放在一个tube中。

◆ tube

一个有名的任务队列，用来存储统一类型的job，是producer和consumer操作的对象。

◆ producer

Job的生产者，通过put命令来将一个job放到一个tube中。

◆ consumer

Job的消费者，通过reserve/release/bury/delete命令来获取job或改变job的状态。

Beanstalkd中一个job的生命周期如图所示。一个job有READY, RESERVED, DELAYED, BURIED四种状态。当producer直接put一个job时，job就处于READY状态，等待consumer来处理，如果选择延迟put，job就先到DELAYED状态，等待时间过后才迁移到READY状态。consumer获取了当前READY的job后，该job的状态就迁移到RESERVED，这样其他的consumer就不能再操作该job。当consumer完成该job后，可以选择delete, release或者bury操作;delete之后，job从系统消亡，之后不能再获取;release操作可以重新把该job状态迁移回READY(也可以延迟该状态迁移操作)，使其他的consumer可以继续获取和执行该job;有意思的是bury操作，可以把该job休眠，等到需要的时候，再将休眠的job kick回READY状态，也可以delete BURIED状态的job。正是有这些有趣的操作和状态，才可以基于此做出很多意思的应用，比如要实现一个循环队列，就可以将RESERVED状态的job休眠掉，等没有READY状态的job时再将BURIED状态的job一次性kick回READY状态。

特性：

◆ 优先级

支持0到2**32的优先级，值越小，优先级越高，默认优先级为1024。

◆ 持久化

可以通过binlog将job及其状态记录到文件里面，在Beanstalkd下次启动时可以通过读取binlog来恢复之前的job及状态。

◆ 分布式容错

分布式设计和Memcached类似，beanstalkd各个server之间并不知道彼此的存在，都是通过client来实现分布式以及根据tube名称去特定server获取job。

◆ 超时控制

下载：

服务端：http://kr.github.io/beanstalkd/download.html

客户端：https://github.com/kr/beanstalkd/wiki/client-libraries

安装：

ubuntu

sudo apt-get install beanstalkd

centos

yum install beanstalkd

源码安装

tar -zxvf /usr/bin/beanstalkd/beanstalkd-1.9.tar.gz

cd beanstalkd

make install PERFIX=/usr/bin/beanstalkd

后台启动：

beanstalkd -l 地址 -p 端口号 -z 最大的任务大小(byte) -c &

如果是外部客户端连接，ip地址要写外网地址，这样才能连接上

启动选项

-b DIR wal directory

-f MS fsync at most once every MS milliseconds (use -f0 for “always fsync”)
-F never fsync (default)
-l ADDR listen on address (default is 0.0.0.0)
-p PORT listen on port (default is 11300)
-u USER become user and group
-z BYTES set the maximum job size in bytes (default is 65535)
-s BYTES set the size of each wal file (default is 10485760)
(will be rounded up to a multiple of 512 bytes)
-c compact the binlog (default)
-n do not compact the binlog
-v show version information
-V increase verbosity
-h show this help

php客户端的使用：我使用的是这个简易的类 https://github.com/davidpersson/beanstalk

发送任务

<?php

//发送任务

require_once 'src/Socket/Beanstalk.php';

//实例化beanstalk

$beanstalk = new Socket_Beanstalk(array(

    'persistent' => false, //是否长连接

    'host' => 'ip地址',

    'port' => 11600,  //端口号默认11300

    'timeout' => 3    //连接超时时间

));

if (!$beanstalk->connect()) {

    exit(current($beanstalk->errors()));

}

//选择使用的tube

$beanstalk->useTube('test');

//往tube中增加数据

$put = $beanstalk->put(

    23, // 任务的优先级.

    0,  // 不等待直接放到ready队列中.

    60, // 处理任务的时间.

    'hello, beanstalk' // 任务内容

);

if (!$put) {

    exit('commit job fail');

}

$beanstalk->disconnect();

处理任务：

<?php

require_once 'src/Socket/Beanstalk.php';

//实例化beanstalk

$beanstalk = new Socket_Beanstalk(array(

    'persistent' => false, //是否长连接

    'host' => 'ip地址',

    'port' => 11600,  //端口号默认11300

    'timeout' => 3    //连接超时时间

));

if (!$beanstalk->connect()) {

    exit(current($beanstalk->errors()));

}

//查看beanstalkd状态

//var_dump($beanstalk->stats());

//查看有多少个tube

//var_dump($beanstalk->listTubes());

$beanstalk->useTube('test');

//设置要监听的tube

$beanstalk->watch('test');

//取消对默认tube的监听，可以省略

$beanstalk->ignore('default');

//查看监听的tube列表

//var_dump($beanstalk->listTubesWatched());

//查看test的tube当前的状态

//var_dump($beanstalk->statsTube('test'));

while (true) {

    //获取任务，此为阻塞获取，直到获取有用的任务为止

    $job = $beanstalk->reserve(); //返回格式array('id' => 123, 'body' => 'hello, beanstalk')

    //处理任务

    $result = doJob($job['body']);

    if ($result) {

        //删除任务

        $beanstalk->delete($job['id']);

    } else {

        //休眠任务

        $beanstalk->bury($job['id']);

    }

    //跳出无限循环

    if (file_exists('shutdown')) {

        file_put_contents('shutdown', 'beanstalkd在'.date('Y-m-d H:i:s').'关闭');

        break;

    }

}

$beanstalk->disconnect();

【转】Beanstalkd 队列简易使用的更多相关文章

beanstalkd队列
数据结构里面的队列是先进先出的数据结构,在服务器开发中使用队列可以有效的实现任务的异步处理,把耗时的任务放在一个队列中,由消费者去自动处理,比如客户端用户把错题生成pdf文件下载,可以在客户端点击生成 ...
安装beanstalkd队列问题——No package beanstalkd available
CentOS7.4安装beanstalkd 时无可用源 No package beanstalkd availableError:Nothing to do 可从以下获取:wget /etc/yum. ...
yii2.0 中的队列
a yii2 extension to make simple to use queue. yii2-queue让队列的使用在yii2中变得更轻松,她为各种队列组件的使用提供了一个标准的接口,您只需要 ...
Beanstalkd一个高性能分布式内存队列系统
高性能离不开异步,异步离不开队列,内部是Producer-Consumer模型的原理. 设计中的核心概念: job:一个需要异步处理的任务,是beanstalkd中得基本单元,需要放在一个tube中: ...
beanstalkd 消息队列
概况:Beanstalkd,一个高性能.轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有9.5 million用户的Faceb ...
轻量级队列beanstalkd
一.基本Beanstalkd,一个高性能.轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有9.5 million用户的Face ...
高性能分布式内存队列系统beanstalkd(转)
beanstalkd一个高性能.轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有9.5 million用户的Facebook ...
使用Beanstalkd实现队列
Beanstalkd可以想象成缓存当中的memcahe或者redise,将我们的队列任务放到内存中进行管理. 运行环境是在linux中,反正我的windows中没运行成功.../(ㄒoㄒ)/~~ 首先 ...
Beanstalkd 一个高性能分布式内存队列系统
需要一个分布式内存队列,能支持这些特性:任务不重不漏的分发给消费者(最基础的).分布式多点部署.任务持久化.批量处理.错误重试..... 转载:http://rdc.taobao.com/blog/c ...

随机推荐

【英语魔法俱乐部——读书笔记】 2 中级句型-复句&合句(Complex Sentences、Compound Sentences)
[英语魔法俱乐部——读书笔记] 2 中级句型-复句&合句(Complex Sentences.Compound Sentences):(2.1)名词从句.(2.2)副词从句.(2.3)关系从句 ...
springmvc和http404错误
今天解决一个java中的springmvc的问题,所有配置都是对的,主页面也能打得开,唯独Controller层的方法打不开,一直报http404错误 package com.gold.control ...
CSharper 学Quick-Cocos2d-X (一) 开发环境的搭建
前言本来想写CSharper 学Cocos2dx系列的.但是最近在了解许多跨平台游戏开发框架后最终决定使用Quick-cocos2d-x+lua进行第一个游戏项目的开发.经过一天多的折腾终于 ...
matlab struct结构体用法
结构体的赋值: 结构体的赋值,这里不建议用下面这种形式进行统一赋值, s = sturct('field1',values1,'field2',values2,-) 而是建议直接赋值,就是对每一个属性 ...
mysql workbench
下载地址:http://dev.mysql.com/downloads/ 详情:http://baike.baidu.com/link?url=sWV3b2pWdr8cvCxEZYrB9CzLD9Bl ...
ffmpeg 音频转换: use ffmpeg convert the audio from stereo to mono without changing the video part
To convert the audio from stereo to mono without changing the video part, you can use FFmpeg: ffmpeg ...
关于SharpZipLib压缩分散的文件及整理文件夹的方法
今天为了解决压缩分散的文件时,发现想通过压缩对象直接进行文件夹整理很麻烦,因为SharpZipLib没有提供压缩进某个指定文件夹的功能,在反复分析了SharpZipLib提供的各个接口方法后,终于找到 ...
初步认识html以及表格的制作
12.21,冬至,天空中还下着小雨,雾霾也没有散去,但是也没有冲散节日的气氛,心情也是倍儿好. 今天学习了不少的内容,对我来说是对之前所学的一个巩固,内容比较多也比较杂乱一些,下面以例子的形式来表现: ...
ajax省市区三级联动
jdbc+servlet+ajax开发省市区三级联动技术点:jdbc操作数据库,ajax提交,字符拦截器,三级联动特点:局部刷新达到省市区三级联动,举一反三可以做商品分类等宗旨:从实战中学习博 ...
C#中的?和??的用法
1. 可空类型修饰符(?):引用类型可以使用空引用表示一个不存在的值,而值类型通常不能表示为空.例如:string str=null; 是正确的,int i=null; 编译器就会报错.为了使值类型也 ...

【转】Beanstalkd 队列简易使用

Beanstalkd一个高性能分布式内存队列系统

【转】Beanstalkd 队列简易使用的更多相关文章

随机推荐

热门专题