APscheduler使用总结

APscheduler是执行定时任务的python库，其作用可以代替Linux系统下的crontab，github上有该库的例子。

APsheduler基本使用

该模块由4个基本组件组成：

triggers 触发器
job stores 任务储存
executors 执行器
schedulers 调度器

其中triggers定义了定时任务的类别、触发条件以及具体要执行的任务名。

job stores可以将任务储存起来，有些需要重复执行的任务，或有数据生成的任务，有将数据储存的要求，可以通过数据库或文件的形式将数据储存起来以便下次使用。

executors负责具体的任务执行。

schedulers是最高级的组件，负责其它的管理和调度工作，该模块有几种可选的调度器可供选择，使用方法都是一样的：

BlockingScheduler: use when the scheduler is the only thing running in your process

BackgroundScheduler: use then you’re not using any of the frameworks below, and want the scheduler to run in the background inside your application

AsyncIOScheduler: use if your application uses the asyncio module

GeventScheduler: use if your application uses gevent

TornadoScheduler: use if you’re building a Tornado application

TwistedScheduler: use if you’re building a Twisted application

QtScheduler: use if you’re building a Qt application

定时任务的执行内容放在一个函数中使用，而调度的类型和时间等设置则在创建这个job的时候进行定义，在这个模块中，一个具体的任务是一个JOB实例，因此可以通过修改这个实例的属性对任务进行重新设置，而每一个job实例都是依赖于一个scheduler，所以也可以通过sheduler对sheduler进行重新设定。

定时任务的类型说明

参考源码中scheduler.add_job()的参数说明

'cron'跟linux下crontab一样的定时类型写法，

'interval'使用时间间隔的写法

...

说明

from apscheduler.schedulers.background import BackgroundScheduler

# 创建scheduler

scheduler = BackgroundScheduler()

# 创建job

# 方法1

job = scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id')

# 方法2

@scheduler.scheduled_job

def myfunc():

    # do something

	pass

# 启动

scheduler.start()

# 添加job

scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id')

# 删除job

scheduler.remove_job('my_job_id')

# 暂停job

scheduler.pause_job()

# 恢复job

scheduler.resume_job()

# 查看jobs

scheduler.get_jobs()

scheduler.print_jobs()

# 修改job

scheduler.modify_job(max_instances=6, name='Alternate name')

# 重新设置定时任务类型

scheduler.reschedule_job('my_job_id', trigger='cron', minute='*/5')

# 关闭

scheduler.shutdown(wait=False)

scheduler配置

配置内容

a MongoDBJobStore named “mongo”
an SQLAlchemyJobStore named “default” (using SQLite)
a ThreadPoolExecutor named “default”, with a worker count of 20
a ProcessPoolExecutor named “processpool”, with a worker count of 5
utc标准时区
coalescing turned off for new jobs by default
默认最多3个jobs

方法1

from pytz import utc

from apscheduler.schedulers.background import BackgroundScheduler

from apscheduler.jobstores.mongodb import MongoDBJobStore

from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore

from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor

jobstores = {

    'mongo': MongoDBJobStore(),

    'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')

}

executors = {

    'default': ThreadPoolExecutor(20),

    'processpool': ProcessPoolExecutor(5)

}

job_defaults = {

    'coalesce': False,

    'max_instances': 3

}

scheduler = BackgroundScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults, timezone=utc)

方法2

from apscheduler.schedulers.background import BackgroundScheduler

# The "apscheduler." prefix is hard coded

scheduler = BackgroundScheduler({

    'apscheduler.jobstores.mongo': {

         'type': 'mongodb'

    },

    'apscheduler.jobstores.default': {

        'type': 'sqlalchemy',

        'url': 'sqlite:///jobs.sqlite'

    },

    'apscheduler.executors.default': {

        'class': 'apscheduler.executors.pool:ThreadPoolExecutor',

        'max_workers': '20'

    },

    'apscheduler.executors.processpool': {

        'type': 'processpool',

        'max_workers': '5'

    },

    'apscheduler.job_defaults.coalesce': 'false',

    'apscheduler.job_defaults.max_instances': '3',

    'apscheduler.timezone': 'UTC',

})

方法3

from pytz import utc

from apscheduler.schedulers.background import BackgroundScheduler

from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore

from apscheduler.executors.pool import ProcessPoolExecutor

jobstores = {

    'mongo': {'type': 'mongodb'},

    'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')

}

executors = {

    'default': {'type': 'threadpool', 'max_workers': 20},

    'processpool': ProcessPoolExecutor(max_workers=5)

}

job_defaults = {

    'coalesce': False,

    'max_instances': 3

}

scheduler = BackgroundScheduler()

# .. do something else here, maybe add jobs etc.

scheduler.configure(jobstores=jobstores, executors=executors, job_defaults=job_defaults, timezone=utc)

flask下使用APscheduler

flask下使用该模块可以使用flask扩展模块flask-apsheduler

基本使用

from flask import Flask

from flask_apscheduler import APScheduler

class Config(object):

    JOBS = [

        {

            'id': 'job1',

            'func': 'jobs:job1',

            'args': (1, 2),

            'trigger': 'interval',

            'seconds': 10

        }

    ]

    SCHEDULER_API_ENABLED = True

def job1(a, b):

    print(str(a) + ' ' + str(b))

if __name__ == '__main__':

    app = Flask(__name__)

    app.config.from_object(Config())

    scheduler = APScheduler()

    # it is also possible to enable the API directly

    # scheduler.api_enabled = True

    scheduler.init_app(app)

    scheduler.start()

    app.run()

故障排除

在使用gunicorn对flask进行管理的时候如何保证只定时任务只启动一次

问题在使用gunicorn对flask应用进行控制的时候如果设置了gunicorn的--worker参数大于1时，会出现一个定时任务执行多次的问题，此时要给gunicorn提供一个额外的--preload参数，这样，flask的app在run之前的所有操作只会执行一次，因此定时任务就只会执行一次。

env/bin/gunicorn module_containing_app:app -b 0.0.0.0:8080 --workers 3 --preload

flask在调试模式下调用flask-apscheduler定时任务时会执行多次

问题与上面的问题类似，调试模式下只需给app.run()添加一个参数use_reloader即可。

app.run(debug=True, use_reloader=False)

APscheduler总结的更多相关文章

Python任务调度模块 – APScheduler
APScheduler是一个Python定时任务框架,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务.并以daemon方式运行应用.目前最新版本为3.0 ...
python3使用pyinstaller打包apscheduler出的错
本来只是想用Python做一个定时任务小工具在服务器上运行,可是服务器在隔离区,各种禁止上外网,使用pip导出列表那种下载库的方法不管用,导致Python的各种库都下不到,官网离线下载又各种缺依赖,好 ...
Python定时任务框架APScheduler 3.0.3 Cron示例
APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务.基 ...
apscheduler 绿色版
由于依赖EntryPoint,因此apscheduler在离线的方式(直接拷贝然后引用)使用时,会报错. 错误信息类似: No trigger by the name “interval/cron/d ...
apscheduler 排程
https://apscheduler.readthedocs.org/en/v2.1.2/cronschedule.html 参数说明 year 4位年 month 月份1-12 day 日:1- ...
APScheduler —— Python化的Cron
APScheduler全程为Advanced Python Scheduler,是一款轻量级的Python任务调度框架.它允许你像Cron那样安排定期执行的任务,并且支持Python函数或任意可调用的 ...
apscheduler的使用
最近一个程序要用到后台定时任务,看了看python后台任务,一般2个选择,一个是apscheduler,一个celery.apscheduler比较直观简单一点,就选说说这个库吧.网上一搜索,晕死,好 ...
定时任务框架APScheduler学习详解
APScheduler简介在平常的工作中几乎有一半的功能模块都需要定时任务来推动,例如项目中有一个定时统计程序,定时爬出网站的URL程序,定时检测钓鱼网站的程序等等,都涉及到了关于定时任务的问题,第 ...
django-xadmin中APScheduler的启动初始化
环境: python3.5.x + django1.9.x + xadmin-for-python3 APScheduler做为一个轻量级和使用量很多的后台任务计划(scheduler)包,可以方便 ...
flask+apscheduler+redis实现定时任务持久化
在我们开发flask的时候,我们会结合apscheduler实现定时任务,我们部署到服务器上,会不会遇到这样的问题,每次我们部署后,我们重启服务后,原来的定时任务都需要重启,这样对我们经常迭代的项目肯 ...

随机推荐

Spark 源码阅读——任务提交过程
当我们在使用spark编写mr作业是,最后都要涉及到调用reduce,foreach或者是count这类action来触发作业的提交,所以,当我们查看这些方法的源码时,发现底层都调用了SparkCon ...
Android面试收集录9 IntentService详解
一. 定义 IntentService是Android里面的一个封装类,继承自四大组件之一的Service. 二.作用处理异步请求,实现多线程三. 工作流程注意:若启动IntentService ...
PHP代码审计5-实战漏洞挖掘-cms后台登录绕过
cms后台登录绕过练习源码:[来源:源码下载](数据库配置信息有误,interesting) 注:需进行安装 1.创建数据库 2.设置账号密码,连接数据库 3.1 正常登录后台,抓包分析数据提交位置 ...
java练习——接口与继承
父类与子类的构造方法: 如果父类中有一个默认无参的构造方法,那么子类的构造方法中会自动进行调用.如果父类有自己的构造方法,且这时父类没有默认无参的构造方法,那么在子类的构造方法中,必须要调用父类的某个 ...
CNN：
(1)卷积:对图像元素的矩阵变换,是提取图像特征的方法,多种卷积核可以提取多种特征.一个卷积核覆盖的原始图像的范围叫做感受野(权值共享).一次卷积运算提取的特征往往是局部的,难以提取出比较全局的特征, ...
APP遇到大量的真实手机号刷注册用户该如何应对？
欢迎访问网易云社区,了解更多网易技术产品运营经验. 在说如何应对之前,先给各位梳理移动端APP可能遇到哪些作弊风险.1. 渠道商刷量,伪造大量的下载量和装机量,但没有新用户注册:2. 对于电商.P2P ...
Spring+SpringMVC+MyBatis+Redis框架学习笔记
在Java互联网中,以Spring+Spring MVC+MyBatis (SSM) 作为主流框架. SSM+Redis的结构图在这种框架系统中: Spring IoC 承担了一个资源管理.整合.即 ...
JFinal 添加Druid插件
第一步:添加依赖 <dependency> <groupId>com.alibaba</groupId> <artifactId>druid</a ...
python之列表/元组/字典/字符串
一.列表格式:list = ['xxx','xxx','xxx'] 性质:可以修改列表内容 copy用法: import copy names = ['] names01 = names #直接引用 ...
Python 自学 Day1
作业二:编写登陆接口输入用户名密码认证成功后显示欢迎信息输错三次后锁定 #!/usr/bin/env python import getpass def log(): uname = input ...

APscheduler总结