celery学习笔记2
1.定义:
Celery是一个异步的任务队列(也叫做分布式任务队列)
2.工作结构
Celery分为3个部分
(1)worker部分负责任务的处理,即工作进程(我的理解工作进程就是你写的python代码,当然还包括python调用系统工具功能)
(2)broker部分负责任务消息的分发以及任务结果的存储,这部分任务主要由中间数据存储系统完成,比如消息队列服务器RabbitMQ、redis、Amazon SQS、MongoDB、IronMQ等或者关系型数据库,使用关系型数据库依赖sqlalchemy或者django的ORM
(3)Celery主类,进行任务最开始的指派与执行控制,他可以是单独的python脚本,也可以和其他程序结合,应用到django或者flask等web框架里面以及你能想到的任何应用
3.话不多说,用起来
(1)安装Celery(要安装celery3版本,4版本改动较大没测试)
pip install celery==3.1.17
(2)broker部分此处使用安装好的redis服务6380端口的db0作为消息队列,普通redis服务的安装此处不做介绍
(3)Celery的使用一(单独脚本调用,简单方便)
注:不考虑任务的结果存储情况
<1>/tmp/tasks.py(实际脚本中不要写中文注释)
#!/usr/bin/env python
# -*- coding=utf-8 -*-
from celery import Celery
from celery import platforms
#用于开启root也可以启动celery服务,默认是不允许root启动celery的
platforms.C_FORCE_ROOT = True
#创建一个celery实例,传递进去的第一个参数tasks必须是本文件的文件名tasks,指定broker为本机redis6380服务
celery = Celery('tasks', broker='redis://localhost:6380/0')
#使用celery实例的task装饰器装饰add函数,此处的add函数可以当作后期的耗时任务对待
@celery.task
def add(x,y):
return x + y
<2>启动celery服务
#cd /tmp #celery -A tasks worker --loglevel=info
<3>验证执行任务
导入模块,执行add函数,此处使用add.delay(3,4)而不是add(3,4),因为被celery封装了,要异步执行需要额外使用add.delay(3,4)
需要注意,如果把返回值赋值给一个变量,那么原来的应用程序也会被阻塞,需要等待异步任务返回的结果。因此,实际使用中,不需要把结果赋值。
#cd /tmp #python >>>from tasks import add >>>add.delay(3,4)
celery服务的窗口会刷出任务的信息,以及是否处理成功,以及结果

将来只要在别的程序中引入tasks中的add函数,就是异步的了,是不是有点屌。。。。。
<4>扩展知识,指定队列名
传入redis中的指定队列testq怎么玩?(其他broker引擎也支持)
启动celery服务的时候添加额外参数-Q '队列名'
#cd /tmp #celery -A tasks.tasks worker --loglevel=info -Q 'testq'
跑任务的时候指定testq队列名
#cd /tmp #python >>>from tasks import add >>>add.delay(3,4,queue='testq')
<5>扩展知识,指定开启的worker进程数(底层是调用的Python的multiprocessing模块中的Pool进程池思想来做)
-c 5 开启5个worker进程来同时抢任务,跑任务
#cd /tmp #celery -A tasks.tasks worker --loglevel=info -c 5
<6>扩展知识,管理broker里面的数据,查看任务状态,以及任务的详细信息
安装一个叫flower的webui,提供任务查询,worker生命管理,以及路由管理等(底层是通过tornado框架封装的)
#pip install flower #任意目录下执行都可以 #celery flower --port=5555 --broker=redis://localhost:6380/0
里面可以看到任务参数,结果,接受任务时间,任务开始时间,任务状态,Started是任务进行中,Success是任务跑完执行成功

(4)Celery的使用二(项目方式,也叫做Python包方式,结构清晰,低耦合;相比纯脚本方式略复杂,用不用由你)
创建一个叫做proj的Python包(创建Python包的操作此处不做详细说明,tree /tmp/proj)

<1>proj/celery.py
from __future__ import absolute_import 据说添加此行可以低降低出错的概率哦(阿门保佑;其实就是兼容Python版本的一个东东)
创建一个celery的实例,名字叫做app,传递进去的第一个参数是Python包的名字,include加载任务文件,config_from_object指定celery的配置文件(好吧,看起来比单纯使用脚本方式麻烦点,请继续往下看)
#!/usr/bin/env python
# -*- coding=utf-8 -*-
from __future__ import absolute_import
from celery import Celery
app = Celery('proj', include=['proj.tasks'])
app.config_from_object('proj.config')
if __name__ == '__main__':
app.start()
<2>proj/config.py
配置文件里指定broker
#!/usr/bin/env python # -*- coding:utf-8 -*- from __future__ import absolute_import BROKER_URL = 'redis://127.0.0.1:6380/0'
<3>proj/tasks.py
导入celery实例,实例绑定任务
#!/usr/bin/env python
# -*- coding:utf-8 -*-
from __future__ import absolute_import
from proj.celery import app
@app.task
def add(x, y):
return x + y
<4>开启celery服务(特定目录指定包名字启动)
#cd /tmp/ #celery -A proj worker -l info
<5>扩展功能,指定队列名,调整worker进程数,页面管理celery同上,不再做说明
(5)Celery的使用三(django-celery模式;#反正我喜欢用这种)
django调用celery跑异步任务,常见场景有注册成功,发送邮件可以异步来防止网络IO阻塞,以及耗时间的任务,例如需要去跑9000台IP的某些配置参数任务,或者下发任务执行,可能需要10几分钟才能跑完,就可以WEB应用中使用这种异步方式
<1>安装django-celery软件包
一定要注意celery的版本和django-celery的小版本要保持一致,否则会有各种杂七杂八的小问题(都是泪.......)
#pip install celery==3.1.17 #pip install django-celery==3.1.17
<2>创建celery必须的数据库表结构
#cd Python_20161203 #python manage.py migrate
<3>django项目的settings.py文件中追加如下内容;app呢是django项目里面的应用名字
settings.py
import djcelery
djcelery.setup_loader()
BROKER_URL = 'redis://127.0.0.1:6380/0'
CELERY_RESULT_BACKEND = 'redis://127.0.0.1:6380/1'
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'
CELERY_ACCEPT_CONTENT = ['json']
CELERY_IMPORTS = ('app.tasks', )
CELERYBEAT_SCHEDULER = 'djcelery.schedulers.DatabaseScheduler'
CELERYD_CONCURRENCY = 20
参数说明(可以根据自己的需求添加自己的参数):
CELERY_RESULT_BACKEND = "redis://127.0.0.1:6380/1'" #结果存储
CELERY_TASK_RESULT_EXPIRES = 1200 # celery任务执行结果的超时时间,我的任务都不需要返回结果,只需要正确执行就行
CELERYD_CONCURRENCY = 20 # celery worker的并发数 也是命令行-c指定的数目,事实上实践发现并不是worker也多越好,保证任务不堆积,加上一定新增任务的预留就可以
CELERYD_PREFETCH_MULTIPLIER = 4 # celery worker 每次去redis取任务的数量,我这里预取了4个慢慢执行,因为任务有长有短没有预取太多
CELERYD_MAX_TASKS_PER_CHILD = 200 # 每个worker执行了多少任务就会死掉,我建议数量可以大一些,比如200
CELERYBEAT_SCHEDULER = 'djcelery.schedulers.DatabaseScheduler' # 这是使用了django-celery默认的数据库调度模型,任务执行周期都被存在你指定的orm数据库中

<4>app/tasks.py(在django的app应用目录下创建tasks.py任务文件,里面调用复杂的任务函数)
#!/usr/bin/env python
# -*- coding=utf-8 -*-
###############################
from __future__ import absolute_import
from celery import task
import time
#task装饰器封装了celery函数,为耗时的操作
@task
def add(x,y):
for i in range(30):
print i
time.sleep(1)
return x + y
<5>添加验证功能,查看实际效果
app/urls.py
urlpatterns = [ url(r'^celery_test/,views.celery_test), ]
app/views.py
def celery_test(request):
from tasks import add
add.delay(4,8)
return HttpResponse('Celery testing666')
<6>开启djanog服务和celery服务(虽然耦合了,但是还是需要额外开启)
#python manage.py runserver 0.0.0.0:8000 #另一个窗口开启celery服务 #python manage.py celery worker --loglevel=info
<7>发送http的GET请求,调用celery去执行异步任务(大功告成)
celery那端的屏幕输出如下:
[2016-12-01 16:16:00,940: INFO/MainProcess] Received task: app.tasks.add[06a8d603-a7d3-4732-b8f3-ad010d531200] [2016-12-01 16:16:00,941: WARNING/Worker-1] 0 [2016-12-01 16:16:01,943: WARNING/Worker-1] 1 [2016-12-01 16:16:02,945: WARNING/Worker-1] 2 [2016-12-01 16:16:03,947: WARNING/Worker-1] 3 [2016-12-01 16:16:04,948: WARNING/Worker-1] 4 [2016-12-01 16:16:05,950: WARNING/Worker-1] 5 [2016-12-01 16:16:06,952: WARNING/Worker-1] 6 [2016-12-01 16:16:07,954: WARNING/Worker-1] 7 [2016-12-01 16:16:08,955: WARNING/Worker-1] 8 [2016-12-01 16:16:09,957: WARNING/Worker-1] 9 [2016-12-01 16:16:10,958: WARNING/Worker-1] 10 [2016-12-01 16:16:11,959: WARNING/Worker-1] 11 [2016-12-01 16:16:12,961: WARNING/Worker-1] 12 [2016-12-01 16:16:13,962: WARNING/Worker-1] 13 [2016-12-01 16:16:14,964: WARNING/Worker-1] 14 [2016-12-01 16:16:15,964: WARNING/Worker-1] 15 [2016-12-01 16:16:16,966: WARNING/Worker-1] 16 [2016-12-01 16:16:17,968: WARNING/Worker-1] 17 [2016-12-01 16:16:18,969: WARNING/Worker-1] 18 [2016-12-01 16:16:19,971: WARNING/Worker-1] 19 [2016-12-01 16:16:20,973: WARNING/Worker-1] 20 [2016-12-01 16:16:21,974: WARNING/Worker-1] 21 [2016-12-01 16:16:22,976: WARNING/Worker-1] 22 [2016-12-01 16:16:23,978: WARNING/Worker-1] 23 [2016-12-01 16:16:24,979: WARNING/Worker-1] 24 [2016-12-01 16:16:25,981: WARNING/Worker-1] 25 [2016-12-01 16:16:26,982: WARNING/Worker-1] 26 [2016-12-01 16:16:27,984: WARNING/Worker-1] 27 [2016-12-01 16:16:28,986: WARNING/Worker-1] 28 [2016-12-01 16:16:29,987: WARNING/Worker-1] 29 [2016-12-01 16:16:30,990: INFO/MainProcess] Task app.tasks.add[06a8d603-a7d3-4732-b8f3-ad010d531200] succeeded in 30.049149203s: 12
celery学习笔记2的更多相关文章
- celery 学习笔记 01-介绍
celery 学习笔记 01-介绍 celery 是 python 中的常用的任务队列框架,经常用于异步调用.后台任务等工作.celery 本身以 python 写,但协议可在不同的语言中实现,其它语 ...
- celery学习笔记1
生产者消费者模式 在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据由另一个模块来负责处理(此处的模块是广义的,可以是类.函数.线程.进程等).产生数据的模块,就形象地称为生产 ...
- Celery学习笔记
转载请注明出处:点我 我的第一篇博客!嘿嘿! 在公司实习,接触到的第一个项目就用到了Celery,之前是完全没有接触过Celery这玩意,然后花了点时间仔细的研究了下怎么用.在学习过程中也遇到了些问题 ...
- Swift学习笔记一
最近计划把Swift语言系统学习一下,然后将MagViewer用这种新语言重构一次,并且优化一下,这里记录一下Swift的学习笔记. Swift和Objective-C相比,在语法和书写形式上做了很多 ...
- Knockout.js快速学习笔记
原创纯手写快速学习笔记(对官方文档的二手理解),更推荐有时间的话读官方文档 框架简介(Knockout版本:3.4.1 ) Knockout(以下简称KO)是一个MVVM(Model-View-Vie ...
- 【目录】Python学习笔记
目录:Python学习笔记 目标:坚持每天学习,每周一篇博文 1. Python学习笔记 - day1 - 概述及安装 2.Python学习笔记 - day2 - PyCharm的基本使用 3.Pyt ...
- js学习笔记:webpack基础入门(一)
之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...
- PHP-自定义模板-学习笔记
1. 开始 这几天,看了李炎恢老师的<PHP第二季度视频>中的“章节7:创建TPL自定义模板”,做一个学习笔记,通过绘制架构图.UML类图和思维导图,来对加深理解. 2. 整体架构图 ...
- PHP-会员登录与注册例子解析-学习笔记
1.开始 最近开始学习李炎恢老师的<PHP第二季度视频>中的“章节5:使用OOP注册会员”,做一个学习笔记,通过绘制基本页面流程和UML类图,来对加深理解. 2.基本页面流程 3.通过UM ...
随机推荐
- ruby:借助第三方类名如何查找第三方gem名称(zlib为例)
rubygem中含有成千上万的第三方gem,网上书上扩展教程中都有指导如何使用第三方gem的例子.但是如果不幸这些例子都没有提及gem名称的话,如何只凭第三方类名或require名查找gem名称呢?换 ...
- IT咨询顾问:一次吐血的项目救火
年后的一个合作公司上线了一个子业务系统,对接公司内部的单点系统.我收到该公司的技术咨询:项目启动后没有规律的突然无法登录了,重新启动后,登录一断时间后又无法重新登录,对方技术人员一头雾水不知道什么原因 ...
- Spring Boot定时任务应用实践
在Spring Boot中实现定时任务功能,可以通过Spring自带的定时任务调度,也可以通过集成经典开源组件Quartz实现任务调度. 一.Spring定时器 1.cron表达式方式 使用自带的定时 ...
- 80端口被NT kernel & System 占用
新年后正常上班的第一天,客户报告,虚拟机上的网站起不来了. 登录虚拟机的远程桌面,闪几下连接信息,后面就没了,不显示远程桌面.联系虚拟机管理,重启,远程桌面是连上了,网站还是起不来. 查看window ...
- java面试题之分析(二)
QUESTION NO:2 package com.cdu.test; public class Test { static boolean foo(char c) { System.out.pri ...
- JAVA 创建对象4种方法
java创建对象的几种方式 博客分类: java (1) 用new语句创建对象,这是最常见的创建对象的方法.(2) 运用反射手段,调用java.lang.Class或者java.lang.refl ...
- Netty入门
一.NIO Netty框架底层是对NIO的高度封装,所以想要更好的学习Netty之前,应先了解下什么是NIO - NIO是non-blocking的简称,在jdk1.4 里提供的新api,他的他的特性 ...
- Day24 中间件 自定义分页 ModelForm 序列化 缓存 信号
在views里边,怎么导入局部配置和全局配置 from s18day24 import settings #这样导入的是仅仅用户自定义的配置 from django.conf import setti ...
- 设置firefox每次访问网页时检查所存网页的较新版本
我们做技术,经常在写页面的时候需要多次刷新测试,可是浏览器都有自己的缓存机制,一般CSS和图片都会被缓存在本地,这样我们修改 的CSS就看不到效果了,每次都去清空缓存,再刷新看效果,这样操作太麻烦了. ...
- mac上php版本切换
目标:Mac 环境下完成 php 版本之间的切换 在本地开发中很多时候我们需要多个版本的 php 开发环境.在公司中习惯用自己电脑开发的伙伴们,常常因为公司线上环境被迫更换php版本.但有不想降低自己 ...