Python定时任务利器

导语

在工作场景遇到了这么一个场景，就是需要定期去执行一个缓存接口，用于同步设备配置。首先想到的就是Linux上的crontab，可以定期，或者间隔一段时间去执行任务。但是如果你想要把这个定时任务作为一个模块集成到Python项目中，或者想持久化任务，显然crontab不太适用。Python的APScheduler模块能够很好的解决此类问题，所以专门写这篇文章，从简单入门开始记录关于APScheduler最基础的使用场景，以及解决持久化任务的问题，最后结合其他框架深层次定制定时任务模块这几个点入手。

简单介绍

先简单介绍一下Apscheduler模块包含的四种组件：

Trigger触发器
Job作业
Excutor执行器
Scheduler调度器

大概了解了Apscheduler包含的几种概念，现在先来看一下一个简单的示例：

# -*- coding: utf-8 -*-

from apscheduler.schedulers.blocking import BlockingScheduler

import time

def hello():

    print(time.strftime("%c"))

if __name__ == "__main__":

    scheduler = BlockingScheduler()

    scheduler.add_job(hello, 'interval', seconds=5)

    scheduler.start()

示例的输出：

Thu Dec  3 16:01:20 2020

Thu Dec  3 16:01:25 2020

Thu Dec  3 16:01:30 2020

Thu Dec  3 16:01:35 2020

Thu Dec  3 16:01:40 2020

..........

这个简单的示例，我们用上面提到几种组件分析一下运行逻辑：

首先是Scheduler调度器，这个示例使用的BlockingScheduler调度器，在官方文档中的解释是，BlockingScheduler适合当你的这个定时任务程序是唯一运行的程序；换言之，则是BlockingScheduler调度器是一个阻塞调度器，当程序运行这种调度器，进程则会阻塞，无法执行其他操作；
其次是Job作业和触发器，这两个放在一起讲是因为，在定义作业的时候，你就需要选择一个触发器，这里选择的是interval触发器，这种触发器会以固定时间间隔运行作业。换言之，为调度器添加一个hello的工作，并以每5秒的时间间隔执行任务。
最后就是执行器，默认是ThreadPoolExcutor执行器，他们将任务中可调用对象交给线程池执行操作，等完成操作后，执行器会通知调度程序。

内置的三种Trigger触发器类型：

date:特定时间仅运行一次作业
interval: 固定的时间间隔内运行一次作业
cron: 在一天内特定的时间定期运行作业

常见的Scheduler调度器:

BlockingScheduler: 调度程序是流程中唯一运行的东西
BackgroundScheduler: 调度程序在应用程序内部的后台运行时使用
AsyncIOScheduler: 应用程序使用asyncio模块
GeventScheduler: 应用程序使用gevent模块
TornadoScheduler：构建Tornado应用程序时使用
TwistedScheduler: 构建Tornado应用程序时使用
QtScheduler: 在构建QT应用程序时使用

常见的JobStore：

MemoryJobStore
MongoDBJobStore
SQLAlchemyJobStore
RedisJobStore

进阶使用

通过上面一个简单的示例了解大概的工作流程，以及各个组件在整个流程中的作用，以下的示例是Flask Web框架结合使用Apscheduler定时器，定时执行任务。

# -*- coding: utf-8 -*-

from flask import Flask, Blueprint, request

from apscheduler.executors.pool import ThreadPoolExecutor

from apscheduler.schedulers.background import BackgroundScheduler

from apscheduler.jobstores.redis import RedisJobStore

import time

app = Flask(__name__)

executors = {"default": ThreadPoolExecutor(5)}

default_redis_jobstore = RedisJobStore(db=2,

        jobs_key="apschedulers.default_jobs",

        run_times_key="apschedulers.default_run_times",

        host = '127.0.0.1',

        port = 6379

        )

scheduler = BackgroundScheduler(executors=executors)

scheduler.add_jobstore(default_redis_jobstore)

scheduler.start()

def say_hello():

    print(time.strftime("%c"))

@app.route("/get_job", methods=['GET'])

def get_job():

    if scheduler.get_job("say_hello_test"):

        return "YES"

    else:

        return "NO"

@app.route("/start_job", methods=["GET"])

def start_job():

    if not scheduler.get_job("say_hello_test"):

        scheduler.add_job(say_hello, "interval", seconds=5, id="say_hello_test")

        return "Start Scuessfully!"

    else:

        return "Started Failed"

@app.route("/remove_job", methods=["GET"])

def remove_job():

    if scheduler.get_job("say_hello_test"):

        scheduler.remove_job("say_hello_test")

        return "Delete Successfully!"

    else:

        return "Delete Failed"

if __name__ == "__main__":

    app.run(host="127.0.0.1", port=8787, debug=True)

先分析Jobstore，这里使用的是RedisJobstore，将任务序列化存入到Redis数据库中。这里顺便提一下，为什么需要设置作业存储器，原因是当调度器程序崩溃时，仍然能够保留作业，当然选择什么作业存储器，可以根据具体的工作场景，目前主流的mysql，mongodb，redis，SQLite基本都支持;
然后再看看Scheduler，这里使用的时BackgroundScheduler，因为这里要求调度程序不能阻塞flask程序的正常接收请求，所以选在BackgrounScheduler让它在开始执行任务时是在后台运行的，不会阻塞主线程;
最后看看工作的逻辑，这里get_job获取作业的状态，查看作业是否存在，start_job则是先判断作业是否启动，然后再决定启动操作，remove_job则是停止作业。而这里的作业定义则是通过interval触发器，每五秒执行一次say_hello任务；

总结

最后总结一下，首先你要设置一个作业存储器用于在调度程序崩溃重新恢复时，还能够在作业存储器中获取到作业继续执行；然后你需要设置一个执行器，这个根据作业的类型，比如时一个CPU密集型的任务，那就可以用进程池执行器，默认是用线程池执行器；最后创建配置调度器，启动调度，可以在启动前添加作业，也可以在启动后添加，删除，获取作业。(在这里需要明白的一点就是应用程序不会直接去操作作业存储器，作业或者执行器，而是调度器提供适当的接口来处理这些接口。)

ApScheduler是一个不错的定时任务库，能够动态的添加删除，同时也支持不同的触发器类型，这也是它的优势，相反一些如果是静态任务，其实可以用如linux的crontab工具去做定时任务。有关这方面的记录还会持续更新，如果有什么问题，可以提出来，大家一起探讨。

Python定时任务利器—Apscheduler的更多相关文章

Python定时任务框架APScheduler 3.0.3 Cron示例
APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务.基 ...
Python定时任务框架APScheduler
http://blog.csdn.net/chosen0ne/article/details/7842421 APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz ...
[转]Python定时任务框架APScheduler
APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务 ...
Python 定时任务框架 APScheduler 详解
APScheduler 最近想写个任务调度程序,于是研究了下 Python 中的任务调度工具,比较有名的是:Celery,RQ,APScheduler. Celery:非常强大的分布式任务调度框架 R ...
python 定时任务框架apscheduler
文章目录安装基本概念介绍调度器的工作流程实例1 -间隔性任务实例2 - cron 任务配置调度器方法一方法二方法三: 启动调度器方法一:使用默认的作业存储器: 方法二:使用数据库作 ...
分布式定时任务框架——python定时任务框架APScheduler扩展
http://bbs.7boo.org/forum.php?mod=viewthread&tid=14546 如果将定时任务部署在一台服务器上,那么这个定时任务就是整个系统的单点,这台服务器出 ...
python定时任务：apscheduler的使用（还有一个celery~）
文章摘自:https://www.cnblogs.com/luxiaojun/p/6567132.html 1 . 安装 pip install apscheduler 2 . 简单例子 # codi ...
Python—定时任务（APScheduler实现）
简介 APScheduler的全称是Advanced Python Scheduler.它是一个轻量级的基于Quartz的 Python 定时任务调度框架.APSche ...
python 定时任务 from apscheduler.schedulers.blocking import BlockingScheduler
说明:使用python内置的模块来实现,本篇博客只是以循环定时来示范,其他的可以结合crontab的风格自己设定一.导包 from apscheduler.schedulers.blocking i ...

随机推荐

Linux 入侵痕迹清理技巧
清除history历史命令记录 vim ~/.bash_history //编辑history记录文件,删除部分不想被保存的历史命令 history -c //清除当前用户的history命令记录 H ...
[原题复现]百度杯CTF比赛十月场 WEB EXEC(PHP弱类型)
简介原题复现: 考察知识点:PHP弱类型. 线上平台:https://www.ichunqiu.com/battalion(i春秋 CTF平台) 过程看源码发现这个 vim泄露下方都试了 ...
前后端分离中，使用swagger2和WireMock提高开发速度
一.使用swagger2生成接口文档依赖 <dependency> <groupId>io.springfox</groupId> <artifactId& ...
深度分析：面试90%被问到的 Session、Cookie、Token，看完这篇你就掌握了！
Cookie 和 Session HTTP 协议是一种无状态协议,即每次服务端接收到客户端的请求时,都是一个全新的请求,服务器并不知道客户端的历史请求记录:Session 和 Cookie 的主要目的 ...
ABBYY FineReader 14扫描和保存文档
在ABBYY FineReader 14中您可以使用扫描"新建任务"窗口选项卡上的内置任务创建各种格式的数字文档.本文介绍使用FineReader 14扫描和保存文档的方法. 1. ...
【PYTHON】操作excel笔记
import xlrd book = xlrd.open_workbook('..//data//case1.xls') # 获取excel对象 print(book.sheets()) # 获取ex ...
Redis 基础设计结构之三 hash（哈希）
Redis 有 5 种基础数据结构,分别为:string (字符串).list (列表).set (集合).hash (哈希) 和 zset (有序集合). 今天来说一下hash(哈希),hash的数 ...
自学linux——13.Linux下mysql的安装
MySQL数据库 1.数据库联系 2.软件安装 (1)源码包安装优点:开源,可以修改源代码编译安装,更加适合自己的系统,稳定高效缺点:安装步骤较多,容易出错编译过程时间较长常用语法: #tar ...
这几个很实用的Linux命令，千万别忘记了！
java线程与内存的关系
转载: https://blog.csdn.net/hellozhxy/article/details/91972846

Python定时任务利器—Apscheduler

导语

简单介绍

进阶使用

总结

Python定时任务利器—Apscheduler的更多相关文章

随机推荐

热门专题