附件  Gearman.doc

1:介绍gearman

1.1 简介

Gearman是一个用来把工作委派给其他机器、分布式的调用更适合做某项工作的机器、并发的做某项工作在多个调用间做负载均衡、或用来在调用其它语言的函数的系统

开源:Gearman免费并且开源而且有一个非常活跃的开源社区,如果你想来做一些贡献,请点击 。

多语言支持:Gearman支持的语言种类非常丰富。让我们能够用一种语言来编写Worker程序,但是用另外一种语言编写Client程序。

灵活:不必拘泥于固定的形式。您可以采用你希望的任何形式,例如 Map/Reduce。

快速:Gearman的协议非常简单,并且有一个用C语言实现的,经过优化的服务器,保证应用的负载在非常低的水平。

可植入:因为Gearman非常小巧、灵活。因此您可以将他置入到现有的任何系统中。

没有单点:Gearman不仅可以帮助扩展系统,同样可以避免系统的失败

但有弊端就是占用系统资源较多,例如CPU、内存

1.2 使用场景

将任务分发到多台服务器周期性的并发执

邮件短信发送

异步

跨语言相互调用(对于密集型计算的需求,可以用C实现,PHP直接调用)

典型架构:

1.3 工作原理

一个Gearman请求的处理过程涉及三个角色:Client -> Job -> Worker。

Client:请求的发起者,可以是 C,PHP,Perl,MySQL UDF 等等。

Job:请求的调度者,用来负责协调把 Client 发出的请求转发给合适的 Worker。

Worker:请求的处理者,可以是 C,PHP,Perl 等等。

因为 Client,Worker 并不限制用一样的语言,所以有利于多语言多系统之间的集成。

甚至我们通过增加更多的 Worker,可以很方便的实现应用程序的分布式负载均衡架构。

2:linux下安装Gearman

2.1准备安装软件

Gearman: https://launchpad.net/gearmand/1.2/1.1.2

Php扩展:http://pecl.php.net/get/gearman

2.2编译gearman

基本面

基本的编辑步奏,如果编译有问题,按照

如果提示错误 按照提示相应的解决

编译完成之后:

gearmand -d

启动一个守护进程,gearmand –help 查看相关参数的用途

简单说明:

-d 守护进程模式
-L 监听 IP
-p 端口(7003为旧版本的默认端口,现在已经改为4730)

2.3编译gearman php扩展

操作:

编译后生成 .so 文件 加入到ph.ini中 reload service

extension="gearman.so"

phpinfo() 查看是否开启该模块

3:php 作为worker  client 的基本使用

3.1Worker.php

3.2Client.php

Cli  下运行:

php worker.php &
php client.php

4. Gearman中的TCP消息机制

Gearman中Client和Job、Worker和Job之间的通讯是通过TCP套接字数据包实现
Gearman中的消息是基于TCP的变长二进制消息:
请求和响应分别由Message Flag区分。这是一个4字节的结构。 
Message Type目前共有36个,详细的定义可见http://gearman.org/index.php?id=protocol。它是一个4字节的big-endian的整形。 
Data length定义了消息体的长度。它也是一个4字节的big-endian的整形。 
消息体可由0-N个argument构成,argument间以’\0’分隔。长度是Data Length

5. Gearman中的Job异步和同步的区别

无论是否是哪种类型的 job,worker的工作流程都是一样的:

1.Worker通过CAN_DO消息,注册到Job server上。

2.随后发起GRAB_JOB,主动要求分派任务。

3.Job server如果没有job可分配,就返回NO_JOB。

4.Worker收到NO_JOB后,进入空闲状态,并给Job server返回PRE_SLEEP消息,告诉Job server:”如果有工作来的话,用NOOP请求我先。”

5.Job server收到worker的PRE_SLEEP消息后,明白了发送这条消息的worker已经进入了空闲态。

6.这时如果有job提交上来,Job server会给worker先发一个NOOP消息。

7.Worker收到NOOP消息后,发送GRAB_JOB向Job server请求任务。

8.Job server把工作派发给worker。

9.Worker干活,完事后返回WORK_COMPLETE给Job server。

值得注意的是,第6步中,Job server会给每个发送过PRE_SLEEP消息的worker都发送NOOP 消息,哪个worker先进入到第7步,即哪个worker发送的GRAB_JOB最先被Job server收到,那么这个job就被派发到哪个worker。这一点可以在worker端实现时利用起来,以控制任务的派发策略。也就是说,我们可以通过自定义worker端的请求策略的方式来达到自定义job分派策略的目的

同步调用碰到的缺点:

• 每启动一个Work,Job服务器会自动创建一个Pid文件,这意味着他会占用文件打开句柄数

•当Client个数超过Worker个数的时候会出现排队现象,排队时会加长处理时间

•弥补方式,启动多个Woker迚程,如并发要求300那么启动150个Work

•造成后果,Worker空闲会导致闲置占用资源

•补救方式, –worker-wakeup 参数,指定唤醒多少个 Worker 进行处理。

•突然发现个工具GearmanManager, 可以搞定上面事情~只要简单的使用即可

•传递的参数必须序列化

• Work占用一定内存和cpu,打开过多会占用很多资源非服务群使用效果不明显

异步调用的缺点:

•多个work处理log记录时,容易出现个别log乱序

•Work启动太少且工作时间太长会导致任务堆积,Job服务器占内存过多

•Work内调用的工作函数错误无法处理或通知,只能通过log查看结果

• 如果worker异常,没有接任务的worker很难发现,只能观察Job的持久服务器内的数据量

6. Gearman服务监控

7. Gearman的线程模型

8. Task和Job的区别

9.使用MySQL作为持久队列

10.GearmanJob自动故障转移

鉴于Gearman官网中说到,可以启动多个job服务器实例来保证job的自动故障转移功能,这样当一个job down后可以由另一个job来处理,保证不间断的进行服务。我这里进行了测试,发现Gearman的确实现了自动故障转移功能,我这里的测试如下
1:启动两个虚拟机,分别为: 
A: 安装了PHP环境、Gearman job、Gearman PHP扩展; IP地址:192.168.213.184
B:只需要安装Gearman job;IP地址:192.168.213.185
2:两个虚拟机同时启动Gearman的Job服务器,如下:>./gearmand -d
3:在A虚拟机中编写worker.php,并运行worker实例,如下:
 
 
在以上的基础上,我使用kill -9命令随意关闭掉A、B虚拟机中的任意一个Job服务器,client.php都能正确运行,
说明当一台Job down时,服务仍然能继续进行,并且down的服务器重启后,就可以马上继续服务,不需要任何额外的配置。

gearman 简介的更多相关文章

  1. Gearman简介

    gearman,从名字上看叫做“齿轮工”,就是通过齿轮把不同的组件组合在一起.通常,多语言多系统之间的集成是项目开发中一个比较头疼的问题.一般会采用RPC风格或者是REST风格的WebService. ...

  2. Gearman + Nodejs + MySQL UDF异步实现 MySQL 到 Redis 的数据同步

    [TOC] 1, 环境 CentOS, MySQL, Redis, Nodejs 2, Redis简介 Redis是一个开源的K-V内存数据库,它的key可以是string/set/hash/list ...

  3. gearman安装及初次使用

    官网:  http://gearman.org/ 一篇文章: 利用Gearman实现异步任务处理 一.问题分析 问题:在性能测试过程中,发现用户管理平台在进行图片上传时,性能不佳. 分析:经过代码分析 ...

  4. gearman学习笔记1

    1.简介       gearman是一个分布式开发框架,适合处理一些必须处理但是不影响主流程的操作,比如保存日志.发送邮件.缩略图片等.最早是基于perl语言的,2008年发布的时候改为C++语言开 ...

  5. 跨多种环境部署 Gearman -改善应用程序性能和降低服务器负载

    您可能想要将工作扩散到一个大型机器群体中,或者想要在不同语言和环境之间共享功能,那么开放源码的 Gearman 服务可以让您轻松地将工作分布到网络中的其他机器.本文将介绍 Gearman 的一些典型应 ...

  6. ASP.NET Core 1.1 简介

    ASP.NET Core 1.1 于2016年11月16日发布.这个版本包括许多伟大的新功能以及许多错误修复和一般的增强.这个版本包含了多个新的中间件组件.针对Windows的WebListener服 ...

  7. MVVM模式和在WPF中的实现(一)MVVM模式简介

    MVVM模式解析和在WPF中的实现(一) MVVM模式简介 系列目录: MVVM模式解析和在WPF中的实现(一)MVVM模式简介 MVVM模式解析和在WPF中的实现(二)数据绑定 MVVM模式解析和在 ...

  8. Cassandra简介

    在前面的一篇文章<图形数据库Neo4J简介>中,我们介绍了一种非常流行的图形数据库Neo4J的使用方法.而在本文中,我们将对另外一种类型的NoSQL数据库——Cassandra进行简单地介 ...

  9. REST简介

    一说到REST,我想大家的第一反应就是“啊,就是那种前后台通信方式.”但是在要求详细讲述它所提出的各个约束,以及如何开始搭建REST服务时,却很少有人能够清晰地说出它到底是什么,需要遵守什么样的准则. ...

随机推荐

  1. 《FPGA全程进阶---实战演练》第二十一章之 几种常用电平分析及特性

    TTL,CMOS以及LVTTL,LVCMOS TTL和CMOS是数字电路中两种常见的逻辑电平,LVTTL和LVCMOS是两者低电平版本.TTL是流控器件,输入电阻小,TTL电平器件速度快,驱动能力大, ...

  2. 如何在Windows 10安装和使用Linux的Bash shell

    转载自:百度经验 Windwos 10 的周年更新为开发人员提供一个大的新功能:一个完整的,基于Ubuntu的Bash shell中,可以直接在Windows上运行Linux软件. 这使得“Linux ...

  3. SpringMVC系列(一)SpringMVC概述和搭建SpringMVC的第一个helloWord入门程序

    一.SpringMVC 概述 • Spring为展现层提供的基于MVC设计理念的优秀的Web框架,是目前最主流的MVC框架之一 • Spring3.0 后全面超越 Struts2,成为最优秀的 MVC ...

  4. EF + MySql 错误:配置错误 无法识别的元素“providers”

    “/”应用程序中的服务器错误. 配置错误 说明: 在处理向该请求提供服务所需的配置文件时出错.请检查下面的特定错误详细信息并适当地修改配置文件. 分析器错误消息: 无法识别的元素“providers” ...

  5. miRTarBase 数据库简介

    miRTarBase 是一个手 收集的,经过实验验证过miRNA靶基因的数据库,对于每条miRNA靶基因的记录, 都会赋予1个唯一的 miRNA-target interactions (简称MTs) ...

  6. 如何在linux中批量建立用户并设置随机密码

    Ubuntu是基于linux的免费开源操作系统,同时也是真正意义上的“多任务多用户”操作系统,既然是多用户系统,自然就涉及到创建多个用户的问题.同时由于Ubuntu系统中的root用户具有最高权限,无 ...

  7. oracle 11g RAC 在Windows 7下安装

    oracle 11g RAC 在Windows 7下安装 完全要参考RAC11gR2OnWindows.pdf 难点总是在Grid Infrastructure 而安装Grid Infrastruct ...

  8. PostgreSQL安装入门教程

    一.安装 首先,安装PostgreSQL客户端. sudo apt-get install postgresql-client 然后,安装PostgreSQL服务器. sudo apt-get ins ...

  9. 写一个方法,用一个for循环打印九九乘法表

    public class MultiplicationTable { /**  * @description 写一个方法,用一个for循环打印九九乘法表   * @author  wangkun  * ...

  10. UNIX环境编程学习笔记(17)——进程管理之进程的几个基本概念

    lienhua342014-10-05 1 main 函数是如何被调用的? 在编译 C 程序时,C 编译器调用链接器在生成的目标可执行程序文件中,设置一个特殊的启动例程为程序的起始地址.当内核执行 C ...