k8s中controller-runtime并发Reconcile分析
§ 0x01 起因
开发控制器时,团队内一直在讨论是否需要为单个控制器对象添加并发控制(即加锁),最终把 controller-runtime 框架中并发数改为1,同时启用了 k8s 的 leader election机制保证只有单实例来规避并发的可能。
这种做法其实是有问题的,没有搞清楚 controller-runtime 框架本身是什么样的行为,强行把并发限制为1,可能导致性能上不去。
刚好在使用 cluster-api 过程中又遇到另外一个问题,某个 cluster 对象的 Reconcile 过程死锁阻塞了,导致这个对象后续都不再有 Reconcie 日志产生,而且注意到 cluster-api 的默认并发数是10。这两个问题的解答都需要对 controller-runtime 的行为进行梳理。
一般情况下直接看 controller-runtime 的文档就能明白了,不过在看过 https://github.com/kubernetes-sigs/controller-runtime/blob/main/pkg/reconcile/reconcile.go
中的文档,对 Reconcile 的解释,并没有强调同一个对象的并发 Reconcie 行为:是不会并发,还是会有并发?没有体现。没办法只能看代码了。
§ 0x02 无奈地去看源码
最终的关键逻辑在 k8s.io/client-go/util/workqueue/queue.go
中。
Type 对象中有3个关键数据结构。
- queue 队列,用来添加新对象。
- dirty hashset 记录 dirty 的对象集合。一个对象被取出处理时,如果又收到新的对象时,它就是 dirty 的,需要两次处理。 Add 时加入, Done 时取出,重新放回 queue 中。
- processing hashset 正在处理的对象集合。 Get 获取对象时放入,Done 调用时取出。
对应的数据流转图如下:
以上 hashset 的定义如下:
type empty struct{}
type t interface{}
type set map[t]empty
它是一个以泛型为 key 的map 。结合 controller-runtime,它存放的对象类型是 Request,定义如下:
type Request struct {
// NamespacedName is the name and namespace of the object to reconcile.
types.NamespacedName
}
而 types.NamespacedName 是个包含 Namepsace 和 Name 的 struct 类型。
通过分析 Type 类型的 Add 方法,可以解释一个对象 A 正在被 Reconcile 过程中,又有一个事件触发时, controller-runtime 的行为。
Add 上述场景会把对象放在 dirty 集合中,判断已在 processing 集群中则返回。所以解释这个问题的关键在于,set
类型中是是否存在某个元素是如何判断的,即 Request
对象对应的 struct 类型是如何在 map 中取 hash 的。
这种验证比较简单,直说结论:struct 类型是逐个对象迭代计算出的 hash 值,所以同一个对象转换得到的 Request
对象取值是一样的,最终对应的 hash 值 也是一样的。
§ 0x03 结论
即便控制器的并发数不为1,同一个进程中,不会有多个协程同时处理一个对象。
详细如下:
- 正在处于中的对象,Add 调用不会入队,只记录在 dirty 中。
- 对象处于完成后,在 Done 调用时检查,如在 dirty 中,再次入队,开始下一轮的处理。保证不丢事件。
这种设计核心思想是,用 map 对事件进行合并;使用队列保证顺序。
k8s中controller-runtime并发Reconcile分析的更多相关文章
- K8s中Pod健康检查源代码分析
了解k8s中的Liveness和Readiness Liveness: 表明是否容器正在运行.如果liveness探测为fail,则kubelet会kill掉容器,并且会触发restart设置的策略. ...
- SpringMVC中 Controller的 @ResponseBody注解分析
需求分析:需要 利用 out 对象返回给财付通是否接收成功 .那么将需要如下代码: /** * 返回处理结果给财付通服务器. * @param msg: Success or fail. * @ ...
- k8s deployment controller源码分析
deployment controller简介 deployment controller是kube-controller-manager组件中众多控制器中的一个,是 deployment 资源对象的 ...
- k8s replicaset controller分析(2)-核心处理逻辑分析
replicaset controller分析 replicaset controller简介 replicaset controller是kube-controller-manager组件中众多控制 ...
- 详解SpringMVC中Controller的方法中参数的工作原理[附带源码分析]
目录 前言 现象 源码分析 HandlerMethodArgumentResolver与HandlerMethodReturnValueHandler接口介绍 HandlerMethodArgumen ...
- 【MVC - 参数原理】详解SpringMVC中Controller的方法中参数的工作原理[附带源码分析]
前言 SpringMVC是目前主流的Web MVC框架之一. 如果有同学对它不熟悉,那么请参考它的入门blog:http://www.cnblogs.com/fangjian0423/p/spring ...
- k8s replicaset controller分析(1)-初始化与启动分析
replicaset controller分析 replicaset controller简介 replicaset controller是kube-controller-manager组件中众多控制 ...
- k8s replicaset controller 分析(3)-expectations 机制分析
replicaset controller分析 replicaset controller简介 replicaset controller是kube-controller-manager组件中众多控制 ...
- k8s endpoints controller分析
k8s endpoints controller分析 endpoints controller简介 endpoints controller是kube-controller-manager组件中众多控 ...
- k8s client-go源码分析 informer源码分析(5)-Controller&Processor源码分析
client-go之Controller&Processor源码分析 1.controller与Processor概述 Controller Controller从DeltaFIFO中pop ...
随机推荐
- Kubernetes(四)Pod详解
Pod详解 本章主要介绍Pod资源的各种配置(yaml文件)和原理 1. Pod介绍 如上图所示,每个Pod中都可以包含一个或多个Container,这些Containers 可以分为2类: 用户程序 ...
- 逆向通达信 x 逆向微信 x 逆向Qt
本篇在博客园地址https://www.cnblogs.com/bbqzsl/p/18252961 本篇内容包括: win32窗口嵌入Qt UI.反斗玩转signal-slot.最后 通达信 x 微信 ...
- NXP i.MX 8M Mini工业级核心板规格书(四核ARM Cortex-A53 + 单核ARM Cortex-M4,主频1.6GHz)
1 核心板简介 创龙科技SOM-TLIMX8是一款基于NXP i.MX 8M Mini的四核ARM Cortex-A53 + 单核ARM Cortex-M4异构多核处理器设计的高端工业级核心板,AR ...
- vulhub - INFOSEC PREP: OSCP
vulhub - INFOSEC PREP: OSCP 信息收集 nmap 192.168.157.0/24 nmap -sT --min-rate 10000 -p- 192.168.157.162 ...
- Polar靶场web刷题记录
Polar靶场 web刷题记录 简单部分 swp 考点:敏感文件.preg_match()函数绕过 根据题目名提示 访问 /.index.php.swp 可以用代码格式化工具美化一下 function ...
- vol2以及mimikatz插件安装教程
volatility2安装 https://github.com/volatilityfoundation/volatility git clone https://github.com/volati ...
- 基于Redis在定时任务里判断其他定时任务是否已经正常执行完的方案
执行的定时任务是基于其他定时任务计算得到的结果基础上做操作的,那么如何来确定其他存在数据依赖的定时任务已经执行完成呢? 在分布式环境里,可通过集群的redis来解决这个问题: 即,在跑批任务开始时,将 ...
- CF620E
题目 CF620E 思路 这个题是一个在树上操作的题,每次操作的对象都是以一个结点为根的子树,在1e5的操作下暴力做法必然会超时 观察到c的范围很小,可以考虑状态压缩 考虑将此问题转化为区间问题,利用 ...
- 一天快速入门Django:从0到1创建属于自己的Web应用
DjangoWeb开发 Day1 1. Django的安装 pip install django 2. 创建项目 2.1 终端创建 "python环境路径\scripts\django-ad ...
- PowerShell pnpm 报错
Vue3> pnpm run dev pnpm : 无法加载文件 D:\program files\nodejs\node_global\pnpm.ps1.未对文件 D:\program fil ...