celery 和 haystack

celery 是分布式异步框架

haystack 是全文检索只能在Django中用。

一、什么是celery？ ---->它是Python写的，所以只支持Python使用。但是消息队列是通用的任何语言都可以用。

　　celery英文翻译是芹菜。

　　celery是一个简单、灵活且可靠的、处理大量消息的分布式系统。

　　专注于实时处理的异步任务队列。

　　同时也支持任务调度。

celery 架构由消息中间件broker、任务执行单元worker、任务执行结果存储task result store，这三部分组成。

user代表咱们程序员写的代码，咱们提交一些执行的任务，比如说发个邮件。---提交到celery框架--->amqp broker 消息队列----->celery worker 具体执行------>task result store 结果的存储。

用户提交一些任务，任务就是一些函数-----提交到消息队列，排队等着去执行。生产者消费者模型

amqp broker 消息队列------>消息中间件--->celery本身不提供消息服务，但是可以方便的和第三方提供的消息中间件组成。包括。rabbitMQ，Redis（可以做数据库，可以做缓存，可以做数据队列...我们会详细介绍这个redis）等等

celery worker 具体执行------>任务执行单元--->worker是celery提供的任务执行的单元，worker并发的运行在分布式的系统节点中。

task result store 结果的存储------>任务执行存储结果存储--->用来存储worker执行的任务的结果，celery支持以不同方式存储任务的结果，包括AMOB，redis等。

什么是消息队列？

什么是异步处理？

Celery version 4.0 runs on

        Python ❨2.7, 3.4, 3.5❩

        PyPy ❨5.4, 5.5❩

    This is the last version to support Python 2.7, and from the next version (Celery 5.x) Python 3.5 or newer is required.

    If you’re running an older version of Python, you need to be running an older version of Celery:

        Python 2.6: Celery series 3.1 or earlier.

        Python 2.5: Celery series 3.0 or earlier.

        Python 2.4 was Celery series 2.2 or earlier.

    Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues related to that platform.

celery 版本支持情况　

二、使用场景

　　异步任务：将耗时操作任务提交给celery去异步执行，比如发送短信/邮件、消息推送、音视频处理等等

　　定时任务：定时执行某件事情，比如每天数据统计。

安装

pip源或者pip3 install celery == 版本号

三、基本使用

        -1.生成一个celery对象(传参数),cel.task装饰器,装饰函数(这个函数就可以被提交到任务队列中)

        -2.把函数提交到任务队列中 函数.delay(参数)

        -3.启动worker:celery worker -A celery_task -l info -P eventlet

        -4.查询任务执行结果

-简单使用

1、首先需要生成celery对象（传参数），并写个任务（函数）---->提交任务---->查询任务结果---->开启worker---->查询结果

创建项目celerytest

创建py文件：celery_app_task.py

import celery

import time

# broker='redis://127.0.0.1:6379/2' 不加密码

backend='redis://:123456@127.0.0.1:6379/1'

broker='redis://:123456@127.0.0.1:6379/2'

cel=celery.Celery('test',backend=backend,broker=broker)

@cel.task

def add(x,y):

    return x+y

创建py文件：add_task.py,添加任务

from celery_app_task import add

result = add.delay(4,5)

print(result.id)

创建py文件：run.py，执行任务，或者使用命令执行：celery worker -A celery_app_task -l info

注：windows下：celery worker -A celery_app_task -l info -P eventlet

from celery_app_task import cel

if __name__ == '__main__':

    cel.worker_main()

    # cel.worker_main(argv=['--loglevel=info')

rom celery.result import AsyncResult

from celery_app_task import cel

async = AsyncResult(id="e919d97d-2938-4d0f-9265-fd8237dc2aa3", app=cel)

if async.successful():

    result = async.get()

    print(result)

    # result.forget() # 将结果删除

elif async.failed():

    print('执行失败')

elif async.status == 'PENDING':

    print('任务等待中被执行')

elif async.status == 'RETRY':

    print('任务异常后正在重试')

elif async.status == 'STARTED':

    print('任务已经开始被执行')

四、多任务结构

 pro_cel

    ├── celery_task# celery相关文件夹

    │   ├── celery.py   # celery连接和配置相关文件,必须叫这个名字

    │   └── tasks1.py    #  所有任务函数

    │    └── tasks2.py    #  所有任务函数

    ├── check_result.py # 检查结果

    └── send_task.py    # 触发任务

from celery import Celery

cel = Celery('celery_demo',

             broker='redis://127.0.0.1:6379/1',

             backend='redis://127.0.0.1:6379/2',

             # 包含以下两个任务文件，去相应的py文件中找任务，对多个任务做分类

             include=['celery_task.tasks1',

                      'celery_task.tasks2'

                      ])

# 时区

cel.conf.timezone = 'Asia/Shanghai'

# 是否使用UTC

cel.conf.enable_utc = False

celery.py

import time

from celery_task.celery import cel

@cel.task

def test_celery(res):

    time.sleep(5)

    return "test_celery任务结果:%s"%res

task1.py

import time

from celery_task.celery import cel

@cel.task

def test_celery2(res):

    time.sleep(5)

    return "test_celery2任务结果:%s"%res

task2.py

from celery.result import AsyncResult

from celery_task.celery import cel

async = AsyncResult(id="08eb2778-24e1-44e4-a54b-56990b3519ef", app=cel)

if async.successful():

    result = async.get()

    print(result)

    # result.forget() # 将结果删除,执行完成，结果不会自动删除

    # async.revoke(terminate=True)  # 无论现在是什么时候，都要终止

    # async.revoke(terminate=False) # 如果任务还没有开始执行呢，那么就可以终止。

elif async.failed():

    print('执行失败')

elif async.status == 'PENDING':

    print('任务等待中被执行')

elif async.status == 'RETRY':

    print('任务异常后正在重试')

elif async.status == 'STARTED':

    print('任务已经开始被执行')

check_result.py

from celery_task.tasks1 import test_celery

from celery_task.tasks2 import test_celery2

# 立即告知celery去执行test_celery任务，并传入一个参数

result = test_celery.delay('第一个的执行')

print(result.id)

result = test_celery2.delay('第二个的执行')

print(result.id)

send_task.py

添加任务（执行send_task.py），开启work：celery worker -A celery_task(这是文件夹) -l info -P eventlet，检查任务执行结果（执行check_result.py）

五、设定延时时间让celery执行一个任务

from celery_app_task import add

from datetime import datetime

eta 时间对象为打他time类型

# 方式一

#通过这个方式拿到一个时间对象，就是参数传的时间

# v1 = datetime(2019, 2, 13, 18, 19, 56)     #2019年2月13号18点19分56秒

# print(v1)

#把当地时间转成UTC时间

# v2 = datetime.utcfromtimestamp(v1.timestamp())

# print(v2)

# result = add.apply_async(args=[1, 3], eta=v2)

# print(result.id)

# 方式二

ctime = datetime.now()

# 默认用utc时间

utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())

from datetime import timedelta

#取一个10秒之后的时间

time_delay = timedelta(seconds=10)

#这个时间是当前时间往后推10秒

task_time = utc_ctime + time_delay

# 使用apply_async并设定时间

result = add.apply_async(args=[4, 3], eta=task_time)

print(result.id)

add_task.py

六、设定时间让celery执行一个任务

类似于contab的定时任务

多任务结构中celery.py修改如下

from datetime import timedelta

from celery import Celery

from celery.schedules import crontab

cel = Celery('tasks', broker='redis://127.0.0.1:6379/1', backend='redis://127.0.0.1:6379/2', include=[

    'celery_task.tasks1',

    'celery_task.tasks2',

])

cel.conf.timezone = 'Asia/Shanghai'

cel.conf.enable_utc = False

cel.conf.beat_schedule = {

    # 名字随意命名

    'add-every-10-seconds': {

        # 执行tasks1下的test_celery函数

        'task': 'celery_task.tasks1.test_celery',

        # 每隔2秒执行一次

        # 'schedule': 2.0,

        # 'schedule': crontab(minute="*/1"),

        'schedule': timedelta(seconds=2),

        # 传递参数

        'args': ('test',)

    },

    # 'add-every-12-seconds': {

    #     'task': 'celery_task.tasks2.test_celery2',

    #     每年4月11号，8点42分执行

    #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),

    #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),

    #     'args': (‘test2’，)

    # },

}

第一步：在celery.py里面加：

from datetime import timedelta

from celery.schedules import crontab

cel.conf.beat_schedule = {

    # 名字随意命名

    'add-every-10-seconds': {

        # 执行tasks1下的test_celery函数

        'task': 'celery_task.tasks1.test_celery',

        # 每隔2秒执行一次

        # 'schedule': 1.0,

        # 'schedule': crontab(minute="*/1"),

        'schedule': timedelta(seconds=2),

        # 传递参数

        'args': ('test',)

    },

    # 'add-every-12-seconds': {

    #     'task': 'celery_task.tasks1.test_celery',

    #     每年4月11号，8点42分执行

    #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),

    #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),

    #     'args': (16, 16)

    # },

}

加的内容

第二步：启动一个beat：celery beat -A celery_task -l info ---》启动一个beat往队列里提交任务

第三步：启动work执行：celery worker -A celery_task -l info -P eventlet ----》启动worker

在Django中使用celery

Django-celery版本的要求非常苛刻不仅跟celery版本有关系还跟Django版本有关系。

怎么使用？也需要自己启动worker

第一步：在项目根目录下创建celeryconfig.py

import djcelery

djcelery.setup_loader()

CELERY_IMPORTS=(

    'app01.tasks',

)

#有些情况可以防止死锁

CELERYD_FORCE_EXECV=True

# 设置并发worker数量

CELERYD_CONCURRENCY=4

#允许重试

CELERY_ACKS_LATE=True

# 每个worker最多执行100个任务被销毁，可以防止内存泄漏

CELERYD_MAX_TASKS_PER_CHILD=100

# 超时时间

CELERYD_TASK_TIME_LIMIT=12*30

celeryconfig.py

第二步：在app01目录下创建task.py

from celery import task

@task

def add(a,b):

    with open('a.text', 'a', encoding='utf-8') as f:

        f.write('a')

    print(a+b)

第三步：视图函数view.py

from django.shortcuts import render,HttpResponse

from app01.tasks import add

from datetime import datetime

def test(request):

    # result=add.delay(2,3)

    ctime = datetime.now()

    # 默认用utc时间

    utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())

    from datetime import timedelta

    time_delay = timedelta(seconds=5)

    task_time = utc_ctime + time_delay

    result = add.apply_async(args=[4, 3], eta=task_time)

    print(result.id)

    return HttpResponse('ok')

第四步：setting.py中配置

INSTALLED_APPS = [

    ...

    'djcelery',

    'app01'

]

...

from djagocele import celeryconfig

BROKER_BACKEND='redis'

BOOKER_URL='redis://127.0.0.1:6379/1'

CELERY_RESULT_BACKEND='redis://127.0.0.1:6379/2

启动worker

python3 manage.py celery worker

haystack

1、什么是haystack?

　　是Django的开源全文搜索框架。底层依附于solr、elasticsearch、whoosh...这些库　　

- 全文检索不同于特定字段的模糊查询，使用全文检索的效率更高，并且能够对于中文进行分词处理

- haystack：django的一个包，可以方便地对model里面的内容进行索引、搜索，设计为支持whoosh,solr,Xapian,Elasticsearc四种全文检索引擎后端，属于一种全文检索的框架

- whoosh：纯Python编写的全文搜索引擎，虽然性能比不上sphinx、xapian、Elasticsearc等，但是无二进制包，程序不会莫名其妙的崩溃，对于小型的站点，whoosh已经足够使用

- jieba：一款免费的中文分词包，如果觉得不好用可以使用一些收费产品

2、安装：

pip install django-haystack

pip install whoosh

pip install jieba

3、配置

添加Haystack到INSTALLED_APPS 跟大多数Django的应用一样，你应该在你的设置文件(通常是settings.py)添加Haystack到INSTALLED_APPS. 示例：

INSTALLED_APPS = [

    'django.contrib.admin',

    'django.contrib.auth',

    'django.contrib.contenttypes',

    'django.contrib.sessions',

    'django.contrib.sites',

    # 添加

    'haystack',

    # 你的app

    'blog',

]

修改settings.py 在你的settings.py中，你需要添加一个设置来指示站点配置文件正在使用的后端，以及其它的后端设置。 HAYSTACK——CONNECTIONS是必需的设置，并且应该至少是以下的一种：

#需要设置PATH到你的Whoosh索引的文件系统位置

import os

HAYSTACK_CONNECTIONS = {

    'default': {

        'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',

        'PATH': os.path.join(os.path.dirname(__file__), 'whoosh_index'),

    },

}

# 自动更新索引

HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

whoosh示例

4、处理数据

创建索引

celery 和 haystack的更多相关文章

B2C电商项目
经历四个月的自学. 结合所学的知识(HTML,CSS,javascript,jQuery,Mysql,Redis,Django,celery,fastDfs,haystack,whoosh,uWSGI ...
异步任务队列Celery在Django中的使用
前段时间在Django Web平台开发中,碰到一些请求执行的任务时间较长(几分钟),为了加快用户的响应时间,因此决定采用异步任务的方式在后台执行这些任务.在同事的指引下接触了Celery这个异步任务队 ...
celery使用的一些小坑和技巧(非从无到有的过程)
纯粹是记录一下自己在刚开始使用的时候遇到的一些坑,以及自己是怎样通过配合redis来解决问题的.文章分为三个部分,一是怎样跑起来,并且怎样监控相关的队列和任务:二是遇到的几个坑:三是给一些自己配合re ...
tornado+sqlalchemy+celery,数据库连接消耗在哪里
随着公司业务的发展,网站的日活数也逐渐增多,以前只需要考虑将所需要的功能实现就行了,当日活越来越大的时候,就需要考虑对服务器的资源使用消耗情况有一个清楚的认知. 最近老是发现数据库的连接数如果 ...
celery 框架
转自:http://www.cnblogs.com/forward-wang/p/5970806.html 生产者消费者模式在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据 ...
celery使用方法
1.celery4.0以上不支持windows,用pip安装celery 2.启动redis-server.exe服务 3.编辑运行celery_blog2.py !/usr/bin/python c ...
Celery的实践指南
http://www.cnblogs.com/ToDoToTry/p/5453149.html Celery的实践指南 Celery的实践指南 celery原理: celery实际上是实现了一个典 ...
Using Celery with Djang
This document describes the current stable version of Celery (4.0). For development docs, go here. F ...
centos6u3 安装 celery 总结
耗时大概6小时. 执行 pip install celery 之后, 在 mac 上 celery 可以正常运行, 在 centos 6u3 上报错如下: Traceback (most recent ...

随机推荐

从一个国内普通开发者的视角谈谈Sitecore
一.Sitecore是个神马玩意简而言之,Sitecore就是一个基于ASP.NET技术的CMS系统,它不仅具有传统Web CMS的所有功能,还集成了Marketing营销(当然,这个功能价格不菲) ...
从零开始学习PYTHON3讲义（十）自己做一个“电子记事本”
<从零开始PYTHON3>第十讲截至上一讲,我们已经完成了Python语言的基本部分.我们用了三讲来讨论Python语言的控制结构,用了两讲来介绍Python的基本数据类型.可以说仅就语 ...
Spring Boot(六)：如何优雅的使用 Mybatis
*:first-child{margin-top: 0 !important}.markdown-body>*:last-child{margin-bottom: 0 !important}.m ...
fuzzing学习
1.简介 1.1 fuzzing 模糊测试(fuzzing)是一种通过向程序提供非预期的输入并监控输出中的异常来发现软件中的故障的方法. 用于模糊测试的模糊测试器(fuzzer)可以按照以下3种方式进 ...
centos7 ipaddr 无法查看虚拟机IP解决办法
原因是: CentOS 7 默认是不启动网卡的解决办法:https://blog.csdn.net/wxx729418277/article/details/79130649
【译】最大限度地降低多线程 C# 代码的复杂性
分支或多线程编程是编程时最难最对的事情之一.这是由于它们的并行性质所致,即要求采用与使用单线程的线性编程完全不同的思维模式.对于这个问题,恰当类比就是抛接杂耍表演者,必须在空中抛接多个球,而不要让它们 ...
Android应用跳转到微信和支付宝扫一扫
新版的微信已经把微信功能的schema都禁掉了,意味着我们无法打开微信的扫一扫等功能,目前正常的只能先进入微信(我测试的时候是微信版本7.0.3)已经是很新的版本了具体调起微信扫一扫代码如下,测试后 ...
高通MSM8998 ABL的调试
高通在MSM8998上引入了UEFI,用来代替LK(Little Kernel).高通UEFI由XBL和ABL两部分组成.XBL负责芯片驱动及充电等核心应用功能.ABL包括芯片无关的应用如fastbo ...
使用GDB调试Android Native 层代码
--------------步骤:0. adb root0. adb shell0. ps | grep browser1. gdbserver :5039 --attach pid2. adb fo ...
block的注意点
1). 在block内部使用外部指针且会造成循环引用情况下,需要用__week修饰外部指针: __weak typeof(self) weakSelf = self; 2). 在block内部如果调用 ...

celery 和 haystack

celery 和 haystack的更多相关文章

随机推荐

热门专题