celery 原理理解

这里有一篇写的不错的：http://www.jianshu.com/p/1840035cb510

自己的“格式化”后的内容备忘下：

　　我们总在说c10k的问题，也做了不少优化，然后优化总是不够的。

　　其中的一个瓶颈就是一些耗时的操作（网络请求/文件操作--含耗时的数据库操作）。

　　如果我们不关心他们的返回值，则可以将其做成异步任务，保证执行成功即可。

　　开始阐述之前约定一些概念：

　　　　1. web请求处理进程（简称：消息生产者，记做P），这是我们c10k问题注意的焦点

　　　　2. 消息的处理者（简称：消费者，记做C)，在成功“男人”后面默默无闻工作的“女人”　　

　　　　3. 消息存放的地方（简称：消息队列，记做Q）

　　　　4. 消息/任务，记做T

基本处理过程：

　　　　1. P将T保存到Q

　　　　2. C从Q中取出一个T实例，处理，若处理失败则将T示例退回到Q（务必保证T得到成功处理）。

　　最简单的实现方案：

　　　　redis 消息队列（利用redis list类型）的lpush/rpop(brpop)来处理。python代码如下：

　　　　TaskServer.py

# -*- coding:utf-8 -*-

import traceback

import simplejson

import redis

import uuid

from functools import wraps

class TaskExecutor(object):

	def __init__(self, task_name ,  *args, **kwargs):

		self.queue =  redis.StrictRedis()#host='localhost', port=6378, db=0, password='xxx_tasks')

		self.task_name = task_name

	def _publish_task(self, task_id , func, *args, **kwargs):

		self.queue.lpush(self.task_name,

			simplejson.dumps({'id':task_id, 'func':func, 'args':args, 'kwargs':kwargs})

		)

	def task(self, func):#decorator

		setattr(func,'delay',lambda *args, **kwargs:self._publish_task(uuid.uuid4().hex, func.__name__, *args, **kwargs))

		@wraps(func)

		def _w(*args, **kwargs):

			return func(*args, **kwargs)

		return _w

	def run(self):

		print 'waiting for tasks...'

		while True:

			if self.queue.llen(self.task_name):

				msg_data = simplejson.loads( self.queue.rpop(self.task_name))#这里可以用StrictRedis实例的brpop改善，去掉llen轮询。

				print 'handling task(id:{0})...'.format(msg_data['id'])

				try:

					if msg_data.get('func',None):

						func = eval(msg_data.get('func'))

						if callable(func):

							#print msg_data['args'], msg_data['kwargs']

							ret = func(*msg_data['args'], **msg_data['kwargs'])

							msg_data.update({'result':ret})

							self.queue.lpush(self.task_name+'.response.success', simplejson.dumps(msg_data) )

				except:

					msg_data.update({'failed_times':msg_data.get('failed_times',0)+1, 'failed_reason':traceback.format_exc()})

					if msg_data.get('failed_times',0)<10:#最多失败10次，避免死循环

						self.queue.rpush(self.task_name,simplejson.dumps(msg_data))

					else:

						self.queue.lpush(self.task_name+'.response.failure', simplejson.dumps(msg_data) )

					print traceback.format_exc()

PingTask = TaskExecutor('PingTask')

@PingTask.task

def ping_url(url):

	import os

	os.system('ping -c 2 '+url)

if __name__=='__main__':

	PingTask.run()

运行服务：python TaskServer.py　　

ps:

　　　　1. TaskExecutor类是一个轻量级的celery.Celery实现。提供了 task修饰器。对被修饰的函数添加delay 方法（将原任务方法名/参数保存到redis的list中--FIFO--实际上celery也是类似的处理）

　　　　2. 客户端只要定义自己的TaskExecutor实例以及用此实例的task修饰对应的任务处理函数func。并在代码中待用 func.delay(...)实现异步调用（为了保证成功，最多调用10次）；成功的记录会保存在 redis的 "任务名.response.success" 队列中, 超过10次仍然失败的保存在 “任务名.response.failure"队列中。

　　　　3. 待改进的地方是很多的，比如多线程，负载均衡。（尚未阅读celery源码）

　　TaskClient.py

# -*- coding:utf-8 -*-

import sys

sys.path.append('./')

from my_tasks import ping_url

ping_url.delay('www.baidu.com')

ps：客户端和服务器文件在统一linux目录下。

　celery

　　试验证明， celery目测大体上跟上面的“基本处理过程”基本一致。即：

　　P将T保存在Q中。

　　C从Q中取出T处理（保证成功--会不会死循环？执行一个注定失败的任务--就没有验证了）。

　　celery的运用比较简单:

　　　　1.安装celery　　　

　　　　2.编写需要异步执行的任务函数，并用celery实例的task修饰器修饰

　　　　3.调用异步任务时，用函数名.delay(参数）形式调用为异步调用。函数名（参数）方式为同步调用。

　　　　4.执行celery监听服务

demo 这里有：http://www.jianshu.com/p/1840035cb510。再来一个极简的：

　　　　tasks.py　　　

# -*- coding:utf-8 -*-

from celery import Celery

brokers = 'redis://127.0.0.1:6379/5'

backend = 'redis://127.0.0.1:6379/6'

import time

app = Celery('tasks', backend=backend, broker=brokers)

@app.task

def add(x,y):

    time.sleep(10)

    return x+y

运行celery监听服务：celery -A tasks worker -l error

顺便附上测试代码：tasks_test.py(跟tasks.py同一路径，linux环境）

# -*- coding:utf-8 -*-

import sys

sys.path.append('./')

def test():

        from tasks import add

        for i in range(1000):

                add.delay(i,i+1)

if __name__=='__main__':

        test()

执行之 : python tasks_test.py

(可以1秒内跑完，证明的确异步处理了）

顺便查看了下进程，发现celery自动开了一个主进程，与cpu核数相同的子线程。看了下官方文档，有web监控用的插件（flower)。

安装: sudo pip install flower

运行之（跟tasks.py先同目录）： celery -A tasks flower --port=5555

效果图如下（木有发现失败任务--"Failed tasks"---很遗憾）：

　flower的基本原理推测是直接查询Q，并基于结果输出图表等。

ref: https://abhishek-tiwari.com/post/amqp-rabbitmq-and-celery-a-visual-guide-for-dummies

　　转载请注明来源：http://www.cnblogs.com/Tommy-Yu/p/5955294.html

　　谢谢！

celery 原理理解的更多相关文章

JUC回顾之-ConcurrentHashMap源码解读及原理理解
ConcurrentHashMap结构图如下: ConcurrentHashMap实现类图如下: segment的结构图如下: package concurrentMy.juc_collections ...
POJ1523(割点所确定的连用分量数目,tarjan算法原理理解)
SPF Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 7406 Accepted: 3363 Description C ...
java的classLoader原理理解和分析
java的classLoader原理理解和分析学习了:http://blog.csdn.net/tangkund3218/article/details/50088249 ClassNotFound ...
js 闭包原理理解
问题?什么是js(JavaScript)的闭包原理,有什么作用? 一.定义官方解释:闭包是一个拥有许多变量和绑定了这些变量的环境的表达式(通常是一个函数),因而这些变量也是该表达式的一部分. 很显然 ...
kalman filter卡尔曼滤波器- 数学推导和原理理解-----网上讲的比较好的kalman filter和整理、将预测值和观测值融和
= 参考/转自: 1 ---https://blog.csdn.net/u010720661/article/details/63253509 2----http://www.bzarg.com/p/ ...
debug 调试原理理解
引言: 昨天,看了一篇文章,很受启发,记得之前听别的人远程调试过代码,觉得很神奇,在自己程序里打断点,连接远程服务器,开启调试后可以调用远程方法来看数据的输入和输出,不需要查找问题,重新部署,测试问题 ...
shiro的原理理解
1.shiro原理图如下: 框架解释: subject:主体,可以是用户也可以是程序,主体要访问系统,系统需要对主体进行认证.授权. securityManager:安全管理器,主体进行认证和授权都 ...
celery简单理解和使用
解决同步阻塞的问题将耗时任务放到后台异步执行,不影响用户其他操作. 实现原理任务队列是一种跨线程,跨机器的机制. 任务队列中包含称作任务的工作单元.有专门的进程持续不断的监视任务队列,并从中得到新 ...
JAVA 1.7并发之LinkedTransferQueue原理理解
昨天刚看完BlockingQueue觉得好高级啊,今天扫到1.7就发现了升级版.... 如果对内容觉得不够充分,可以去看http://www.cs.rochester.edu/u/scott/pape ...

随机推荐

Windows下的搜索神器 —— everything
介绍一款Windows下的神奇 -- everything,软件很小巧,但是搜索速度非常快,比Windows自带的搜索功能更强大.更快.掌握它的基本用法,在查找文件时能提升很高的效率 1.下载 2.基 ...
阿里ARouter使用及源码解析（一）
在app的开发中,页面之间的相互跳转是最基本常用的功能.在Android中的跳转一般通过显式intent和隐式intent两种方式实现的,而Android的原生跳转方式会存在一些缺点: 显式inten ...
Andorid之官方导航栏Toobar
在前面学习使用ActionBar的时候,我们就发现ActionBar中有些方法被标记为过时了,原来在android5.0之后,google推出了一个新的导航工具栏,官方将其定义为:A standard ...
Learning to rank的讲解，单文档方法（Pointwise），文档对方法（Pairwise），文档列表方法（Listwise）
学习排序(Learning to Rank) LTR(Learning torank)学习排序是一种监督学习(SupervisedLearning)的排序方法.LTR已经被广泛应用到文本挖掘的很多领域 ...
对actuator的管理端点进行ip白名单限制（springBoot添加filter）
在我们的SpringCloud应用中,我们会引入actuator来进行管理和监控我们的应用常见的有:http://www.cnblogs.com/yangzhilong/p/8378152.html ...
Series转化为DataFrame数据
out=groupby_sum.ix[:'to_uid','sum(diamonds)']使用ix在提取数据的时候,out的数据类型通常为<class 'pandas.core.series.S ...
java的impl
java impl 是一个资源包,用来存放java文件的. 在Java开发中,通常将后台分成几层,常见的是三层mvc:model.view.controller,模型视图控制层三层,而impl通常处于 ...
（原）GAN之pix2pix
转载请注明出处: https://www.cnblogs.com/darkknightzh/p/9175281.html 论文: Image-to-Image Translation with Con ...
11G新特性 -- Statistics Preferences
Statistics Preferences新特性可以实现对指定对象进行信息收集. 可以在table.schema.database.global级别设置statistics preference. ...
React Native for Android应用名及图标修改
应用开发完了,总不能顶着MyProject和小机器人图标就发布了吧?在发布之前,有多处需要修改的地方.今天我们来全面的看一下应用ID 俗称PackageName,或APP ID.注意,在gradle ...

celery 原理理解

celery 原理理解的更多相关文章

随机推荐

热门专题