谈谈 Kubernetes Operator
简介
你可能听过Kubernetes中Operator的概念,Operator可以帮助我们扩展Kubernetes功能,包括管理任何有状态应用程序。我们看到了它被用于有状态基础设施应用程序的许多可能性,包括版本升级、节点恢复、调整集群大小等。
本文我们将揭开Operator的神秘面纱,为如何构建可应用于实际的自定义Operator打下坚实的基础。
operator到底是什么?
为了说明operator到底是什么,让我们回到Kubernetes的架构上来,Kubernetes本质上是理想的状态管理器。你为你的应用程序提供了所需的状态(实例数,磁盘空间,使用的镜像等),并且如果任何事情失控,它都会尝试保持该状态。Kubernetes在Master节点上使用控制面,控制面包含许多控制器,这些控制器的工作是按照下面的方式与期望的状态进行协调(Reconcile):
- 监视现有的K8S对象(pods,deployments等)去确定他们的状态
- 比较该对象和它的K8s yaml配置
- 如果状态和配置不同,控制器将尝试进行修复(remedy)
进行协调的一个常见的场景是:
一个pod被定义了三个副本,当一个挂了,K8s控制器的监视(watching)下,它意识到应该运行三个pod,而不是两个,然后,它将创建一个新的pod实例。
下图简单展示了控制器在K8s架构中的作用:

- kubectl CLI发送一个对象配置(Pod,Deployment等)到Master Node的API Server以便在集群运行
- Master Node将调度(schedule)对象去运行
- 一旦运行,一个控制器将持续件事这个对象并根据它的配置不断协调(Reconcile)
通过这种方式,Kubernetes方便的代替了大量手动工作,以维护运行时的无状态应用。然而,它仅限于K8S预定义的对象类型(Pod,Deployment,Namespace,Service,DaemonSet等),这些对象类型中的每一个都具有预定的行为和方式,如果它们和配置发生了偏离,他们就会与配置相协调(Reconcile),以达到所期望的配置。
现在,如果您的应用程序有更多复杂性,那么你需要自定义Operator以将达到期望的运行状态。
我们考虑一个有状态的应用程序,有一个运行在多个节点上的数据库应用程序。如果大多数节点出现故障,则需要按照特定步骤从指定快照重新加载数据库。使用Kubernetes中现有的对象类型和控制器,这是不可能实现的。再考虑节点扩容,升级新版本,或为我们的有状态应用程序进行灾难恢复。这些类型的操作通常需要非常具体的步骤,并且通常需要手动干预。
Kubernetes Operators允许你定义一个自定义控制器来watch你的应用程序并根据其状态执行自定义任务,从而扩展了Kubernetes(这是使我们上述的有状态应用程序自动维护的完美选择)。
你想要watch的应用程序在Kubernetes中被定义为一个新对象,一个CR(Custom Resource),它有自己的yaml spec和被API Server理解的对象类型(kind)。这样,你可以在自定义spec中定义任何需要关注的特定标准,并在实例与期望不匹配时进行协调。虽然Operator Controller主要使用自定义组件,但是它的spec和本地Kubernetes的控制器非常相似。

Operator 运行自定义控制器以协调spec。虽然API server能感知到自定义控制器,但是Operator是独立运行的,可以在集群内部或外部运行。
由于Operator是有状态应用程序的强大工具,因此我们看到CoreOS和其他贡献Etcd,Prometheus等提供了许多Operator,而这些是一个伟大的起点,但是Operator的价值实际上取决于你对它的处理方式:针对故障的具体做法是什么?以及Operator的功能如何与手动干预一起使用。
尝试构建Operator:
- 定义我们要watch的应用程序的自定义资源CR spec以及该CR的API
- 编写一个Custom Controller来监视我们的应用程序
- 新控制器中的自定义代码,让我们知道如何使我们的CR与spec一致。
- 管理自定义控制器中的Operator
- 为了Operator和CR的一个Deployment
以上这些都可以通过手动编写go代码和spec来实现,同时我们可以使用kubebuild、operator-sdk来生成骨架代码,让我们更方便的去关注核心代码的编写。
参考文章:
https://www.linux.com/topic/cloud/demystifying-kubernetes-operators-operator-sdk-part-1/
谈谈 Kubernetes Operator的更多相关文章
- Kubernetes Operator基础入门
本文转自Rancher Labs 你是否曾经想过SRE团队是如何有效地成功管理复杂的应用?在Kubernetes生态系统中,Kubernetes Operator可以给你答案.在本文中,我们将研究Op ...
- 当我们聊kubernetes operator时,我们在聊些什么
不聊什么 在开始聊operator前,先说说这篇文章里我们不聊什么.我们这里不聊operator的具体实现,不聊operator的由来历史,不聊operator的hello world.如果想了解这些 ...
- Kubernetes Operator: Operator
Operator 就可以看成是 CRD 和 Controller 的一种组合特例,Operator 是一种思想,它结合了特定领域知识并通过 CRD 机制扩展了 Kubernetes API 资源,使用 ...
- [Kubernetes]谈谈Kubernetes的本质
当下k8s算是比较火的一个内容,那么它到底是什么呢,它为什么会这么火呢,它解决的是什么问题呢.这篇文章就尝试着来讲讲,Kubernetes的本质. 当我们谈Kubernetes的时候,总是会想起来Do ...
- Kubernetes Operator: CRD
Custom Resource Define 简称 CRD,是 Kubernetes(v1.7+)为提高可扩展性,让开发者去自定义资源的一种方式.CRD 资源可以动态注册到集群中,注册完毕后,用户可以 ...
- 在Kubernetes上运行有状态应用:从StatefulSet到Operator
一开始Kubernetes只是被设计用来运行无状态应用,直到在1.5版本中才添加了StatefulSet控制器用于支持有状态应用,但它直到1.9版本才正式可用.本文将介绍有状态和无状态应用,一个通过K ...
- 亲历者说:Kubernetes API 与 Operator,不为人知的开发者战争
如果我问你,如何把一个 etcd 集群部署在 Google Cloud 或者阿里云上,你一定会不假思索的给出答案:当然是用 etcd Operator! 实际上,几乎在一夜之间,Kubernetes ...
- Spark in action on Kubernetes - Spark Operator的原理解析
前言 在上篇文章中,向大家介绍了如何使用Spark Operator在kubernetes集群上面提交一个计算作业.今天我们会继续使用上篇文章中搭建的Playground进行调试与解析,帮助大家更深入 ...
- 12 . Kubernetes之Statefulset 和 Operator
Statefulset简介 k8s权威指南这样介绍的 "在Kubernetes系统中,Pod的管理对象RC.Deployment.DaemonSet和Job都面向无状态的服务.但现实中有很多 ...
随机推荐
- Python概述 —变量及运算符
Python概述-变量及运算符 1.变量的构成 2.变量的类型 3.内存模型 4.变量命名规则 5. 算数与逻辑运算符 6.位运算符 #变量的构成 变量名:方便查找 变量值:实际要存储的内容 变量类型 ...
- Redis——(主从复制、哨兵模式、集群)的部署及搭建
Redis--(主从复制.哨兵模式.集群)的部署及搭建 重点: 主从复制:主从复制是高可用redis的基础,主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复. 哨兵和集群都是 ...
- DAG(有向无环图)技术
什么是DAG? DAG的全称为"Directed Acyclic Graph",中文意思为:有向无环图,它由有限个顶点和"有向边"组成,从任意顶点出发,经过若干 ...
- node Cheerio 获取script脚本里的数据
const cheerio = require('cheerio'); const $ = cheerio.load(html); // your html//如果有多少script脚本标签使用循环来 ...
- Typora软件的使用
Typora软件 一.简介 1.该软件编写文档采用markdown格式是目前最为频繁的一种格式 2.该软件生成的文档后缀名是.md结尾 3.下载网址 https://www.typora.io/ 二. ...
- CoRR 2015 | MXNet: A Flexible and Efficient Machine Learning Library for Heterogeneous Distributed Systems
MXNet是一个支持多种编程语言的机器学习库,使用MXNet可以方便地实现机器学习算法,尤其是深度神经网络.通过嵌入在宿主语言中,它将声明式符号表达与命令式张量计算相结合.它提供自动求导以计算梯度.M ...
- [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4)
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 0x00 摘要 0x01 总体流程 ...
- 力扣算法经典第一题——两数之和(Java两种方式实现)
一.题目 难度:简单 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数, 并返回它们的数组下标. 你可以假设每种输入只会对应一 ...
- Spring声明式事务的两种配置方式(注解/xml)
application配置tx:annotation-driven 配置声明式事务tx:TransactionManager 声明式事务需要数据源所以需要配置DataSource 使用:在类或者方法上 ...
- IDEA tomcat启动报错----Artifact is being deployed, please wait...解决
今天学习遇到了这个错误,记录下自己遇到的错误和解决方法! 这个报错的意思是: Artifact 正在部署中,请稍候- 实际上有可能就是jar包没有导进去.检查项目打包情况:file-->Proj ...