还在用crontab? 分布式定时任务了解一下
前言
日常任务开放中,我们会有很多异步、批量、定时、延迟任务要处理,go-zero中有 go-queue,推荐使用 go-queue 去处理,go-queue 本身也是基于 go-zero 开发的,其本身是有两种模式:
dq:依赖于beanstalkd,适合延时、定时任务执行;kq:依赖于kafka,适用于异步、批量任务执行;
本篇就先从 dq 开始,慢慢探究 go-queue 背后执行的逻辑。
dq 简介
dq 封装底层 beanstalkd 操作,分布式存储,延迟、定时设置。重启服务可以重新执行,但是消息不会丢失,因为消息的处理都交由 beanstalkd 完成。
可以看出使用非常简单,同时 dq 中使用了 redis setnx 保证了每个消息只被消费一次。但是在生产者端没有使用 redis 做消息存储,这个和前面描述的一致。
对 dq 的整体架构做了简单介绍,下面就开始正式的探索
生产者 example
func main() {
producer := dq.NewProducer([]dq.Beanstalk{
{
Endpoint: "localhost:11300",
Tube: "tube",
},
{
Endpoint: "localhost:11301",
Tube: "tube",
},
})
for i := 1000; i < 1005; i++ {
// Delay:延迟执行
_, err := producer.Delay([]byte(strconv.Itoa(i)), time.Second*5)
// At:在某一个时刻执行
//_, err := producer.At([]byte(strconv.Itoa(i)), time.Now().Add(time.Second*5))
if err != nil {
fmt.Println(err)
}
}
}
从使用上,简单分为两步:
NewProducer(opts):将本地队列的端口配置和主题配置传入生产者;producer.Delay():使用刚创建好的 生产者,调用它的Delay()。将需要异步发送的消息传入,Delay还需要传入延迟执行的时间。
需要说明的是:创建的 producer 是一个接口,Delay() 只是接口其中的一个方法。后续会其他的方法和内部设计。那我们就继续往下探索吧~~~
深入生产者执行流程
下面从 example 的代码进去,看整个函数的调用链。
初始化
dq.NewProducer([]dq.Beanstalk{{opt1}, {opt2}, ...}) // 初始化生产者
|- NewProducerNode(endpoint, tube) // endpoint,tube 来自传入的配置数组
紧接着就到 producerNode.go ,这个部分就会牵涉到 beanstalk 的初始化:
NewProducerNode(endpoint, tube)
|- conn: newConnection(endpoint, tube)
|- return &connection{}
这就涉及到 beanstalk:connection.conn -> *beanstalk.Conn。
但是在 newConnection() 中并没有对 beanstalk.Conn 进行初始化,这属于 延迟初始化
Delay
首先是生产者端调用 producer.Delay(data, timesecond) ,就把消息插入到内部队列,timesecond 就是延迟执行的时间。我们来看看 Delay() 到底做了什么?
p.Delay(data, timesecond)
|- p.wrap(data, time) // 将 data 和 time 包装到一块
|- p.insert(nodeFn)
|- node.Delay() // for rangre p.node 每一个node都执行一遍 `Delay()`
而 p.insert 就是将上一步封装好的 data 传递给 p{cluster} 的每一个node去执行 node.Delay。
在前面的 初始化说过,最开始是没有对 conn 进行初始化,那现在要插入数据,总不能不初始化这个 conn 。
node.Delay() // 配置中的每个node都执行 `Delay()`
|- node.conn.get() // 获取node中的conn【conn==nil,就初始化一个conn】
|- _, err := conn.Put(data, deplay, opts...)
|- node.conn.reset() // 出现err情况下,如OOM/Timeout等情况 -> 关闭conn,防止泄漏
所以最后 Delay 实际上是执行 tube.Put(data, delay):
tube.Put(data, delay)
|- tube.Conn.cmd("put", ...) // 生产者发布job
这里就涉及到 beanstalk 的 Put 操作:首先看看生产者 Put 指令参数说明:
put <pri> <delay> <ttr> <bytes> <data>
<pri>:优先级,值越小优先级越高,默认为1024;<delay>:延迟ready秒数,在这段时间 job 为delayed状态;<ttr>:time to run,允许 worker 执行的最大秒数,如果 worker 在这段时间不能 delete,release,bury job,那么当 job 超时,服务器将自动 release 此job;<bytes>:job body的长度,不包含\r\n;<data>: job body data;
OK。那插入 job 成功,响应什么呢?
INSERTED <id>\r\n
返回的 id 是插入 job 的任务标识。到此 Put 分析完毕,跟着代码走一遍:
tube.Put(data, priority, daley, ttr)
|- tube.Conn.cmd("put", ...)
|- tube.Conn.readResp("INSERTED id")
|- return id, err // 将id返回
这样我们在 example 中直接可以看到的 生产者 执行的操作就介绍完了。上图,图更好说话:

producer interface
那么除了 example 中使用的 Delay() ,还有其余几个方法:
Producer interface {
At(body []byte, at time.Time) (string, error)
Close() error
Delay(body []byte, delay time.Duration) (string, error)
Revoke(ids string) error
}
At:指定某个时间执行【实质也是执行Delay()】Close:关闭全部node的连接Delay:延迟执行。传入延迟的时间。Revoke:实质上是当出现最小写入节点<2时,触发添加失败,将添加成功的job删除掉。
当然,事实上 dq 使用上,开发者只需要使用 At/Delay 就行了。也就是你只要知道你的任务是定时触发还是延迟触发即可。剩下的,dq 内部的封装都已经帮你做好了。
框架地址
https://github.com/tal-tech/go-queue
同时在 go-queue 也大量使用 go-zero 的流式处理库 fx。
https://github.com/tal-tech/go-zero
欢迎使用 go-queue 并 star 支持我们!一起构建 go-zero 生态!
go-zero 系列文章见『微服务实践』公众号
还在用crontab? 分布式定时任务了解一下的更多相关文章
- 基于spring+quartz的分布式定时任务框架
问题背景 我公司是一个快速发展的创业公司,目前有200人,主要业务是旅游和酒店相关的,应用迭代更新周期比较快,因此,开发人员花费了更多的时间去更=跟上迭代的步伐,而缺乏了对整个系统的把控 没有集群之前 ...
- lesson9:分布式定时任务
在实际的开发过程中,我们一定会遇到服务自有的定时任务,又因为现在的服务都是分布式的,但是对于定时任务,很多的业务场景下,还是只希望单台服务来执行,网上有很多分布式定时任务的框架,各位如感兴趣,可以自行 ...
- 【xxl-job】轻松实现分布式定时任务demo实例
[项目描述]前段时间专门独立了一个spring boot服务,用于做和第三方erp系统的对接工作.此服务的第一个需求工作就是可以通过不同的规则,设置不同的定时任务,从而获取erp系统的商品数据.所以, ...
- Elastic-Job - 分布式定时任务框架
Elastic-Job - 分布式定时任务框架 摘要 Elastic-Job是ddframe中dd-job的作业模块中分离出来的分布式弹性作业框架.去掉了和dd-job中的监控和ddframe接入规范 ...
- Ubuntu下用crontab 部署定时任务
用php做了一个网站,其中一个统计工能,需要每周定时用行.想看看有什么方法,之前看别人的东西,一般有2中方式,一个是php自带的定时任务,一个是用系统 带的,linux下的crontab和window ...
- 【redis】分布式锁实现,与分布式定时任务
如果你还不知道redis的基本命令与基本使用方法,请看 [redis]redis基础命令学习集合 写在前面 redis辣么多数据结构,这么多命令,具体一点,都可以应用在什么场景呢?用来解决什么具体的问 ...
- 第十五章 例行性工作(crontab)--循环执行的例行性工作调度 crontab(定时任务)
循环执行的例行性工作调度 crontab(定时任务) 15.1 例行性工作调度 不考虑硬件与服务器的链接状态,Linux帮助提醒很多任务. Linux例行性工作是如何进行调度的? Linux调度就是通 ...
- 分布式定时任务框架比较,spring batch, tbschedule jobserver
分布式定时任务框架比较,spring batch, tbschedule jobserver | 移动开发参考书 分布式定时任务框架比较,spring batch, tbschedule jobser ...
- CentOS Linux使用crontab运行定时任务详解
参考博文: (总结)CentOS Linux使用crontab运行定时任务详解
随机推荐
- Codeforces Round #529 (Div. 3) C. Powers Of Two (二进制)
题意:给你一个数\(n\),问是否能有\(k\)个\(2\)次方的数构成,若满足,输出一种合法的情况. 题解:从高到低枚举二进制的每一位,求出\(n\)的二进制的\(1\)的位置放进优先队列中,因为\ ...
- vlc音视频开发(二)环境搭建(VS篇)
来源:微信公众号「编程学习基地」 目录 简介 VS配置vlc开发环境 下载vlc源码 创建vlc环境 测试vlc代码 运行vlc程序 完成项目文件获取 简介 VLC 是一款自由.开源的跨平台多媒体播放 ...
- Kerberos原理经典对话
这是MIT(Massachusetts Institute of Technology)为了帮助人们理解Kerberos的原理而写的一篇对话集.里面有两个虚构的人物:Athena和Euripides, ...
- Python——Django框架——Model数据库模型
一.设置 1.Django的setting中配置数据库(MySQL配置) DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql' ...
- redis跳表
redis使用跳表作为有序集合的底层实现之一,下面来看下跳表的结构 一.跳表的结构
- 图像处理中Stride的理解
一行有 11 个像素(Width = 11), 对一个 32 位(每个像素 4 字节)的图像, Stride = 11 * 4 = 44. 但还有个字节对齐的问题, 譬如: 一行有 11 个像素(Wi ...
- 牛客多校第九场H Cutting Bamboos(主席树 区间比k小的个数)题解
题意: 标记为\(1-n\)的竹子,\(q\)个询问,每次给出\(l,r,x,y\).要求为砍区间\(l,r\)的柱子,要求砍\(y\)次把所有竹子砍完,每次砍的时候选一个高度,把比他高的都砍下来,并 ...
- CS144学习(2)TCP协议实现
Lab1-4 分别是完成一个流重组器,TCP接收端,TCP发送端,TCP连接四个部分,将四个部分组合在一起就是一个完整的TCP端了.之后经过包装就可以进行TCP的接收和发送了. 代码全部在github ...
- 虚拟环境之间批量pip安装包"迁移"
在某个虚拟环境中通过 pip freeze > requirements.txt 将该环境下所有的包写入文档, 然后切换至另一虚拟环境, pip install -r requirements. ...
- web online code editor All In One
web online code editor All In One 在线代码编辑器 Monaco Editor 摩纳哥编辑器 ️ 22.1k The Monaco Editor is the code ...