背景

最近在给 opentelemetry-operator提交一个标签选择器的功能时，因为当时修改的函数是私有的，无法添加单测函数，所以社区建议我补充一个 e2e test.

因为在当前的版本下，只要给 deployment 打上了 instrumentation.opentelemetry.io/inject-java: "true" 这类注解就会给该 deployment 注入 agent。

但没办法指定不同的 agent 版本（或者不同的环境变量），所以希望可以新增一个选择器，同时可以针对不同的 deployment 维护不同版本的 Instrumentation(是用于控制需要注入 deployment 的资源)；这样就可以灵活控制了。

在这之前我其实也很少做 kubernetes 的 operator 开发，对如何做 kubernetes 的 e2e 测试也比较陌生，好在社区提供了详细的贡献文档。

安装

简单来说需要两个关键组件：

kind: kubernetes in docker，是可以在本地利用 docker 启动一个 kubernetes 集群的工具，通常用于在本地进行开发、测试关于 kubernetes 相关的功能。
- 安装 kind 的前提是本地已经安装好了 docker。
chainsaw: 一个 e2e 测试框架，提供了声明式的方式定义测试用例，也有着丰富断言功能。

他们的安装都很简单，只要本地安装好了 golang，直接使用 go install 即可：

go install sigs.k8s.io/kind@v0.22.0

go install github.com/kyverno/chainsaw@latest

kind 使用

在开始前还是先预习下 kind 的基本使用。

安装好 kind 之后，使用 create cluster 命令可以在本地创建一个 kubernetes 集群。

kind create cluster -h

Creates a local Kubernetes cluster using Docker container 'nodes'

Usage:

  kind create cluster [flags]

之后只需要等待集群安装成功即可，它会在我们的 cat ~/.kube/config 文件中追加刚才新建集群的连接信息。

k config get-contexts

k config use-context xxx

这样就可以使用这两个命令来查看和切换不同的集群了，虽说是一个本地模拟的 kubernetes 集群，但他的核心功能和一个标准的集群没有什么区别。

kind delete clusters --all

使用完成之后可以使用这个命令将所有集群都删除掉。

准备集群数据

在 opentelemetry-operator 中有给我们准备好一个 make 命令: make prepare-e2e ；使用它会帮我们将 operator 的测试环境初始化好。

大概分为以下几步：

安装 chainsaw
修改 controller 的镜像为我们本地构建的镜像名称
本地 docker 镜像打包
安装 cert-manager
安装 Operator 需要的 CRD
部署 Operator deployment
等待 Operator 启动成功

不过这里的安装过程可能会遇到问题（本质上都是我们的网络问题）：

这种情况可以想办法手动先把镜像拉取到本地，然后 kubernetes 就会从本地仓库获取到这个镜像。

e2e test

通常我们需要将同一类的测试功能放到一个文件夹里，比如这样：

默认情况下 Chainsaw 会查找目录下名为 chainsaw-test.yaml 作为引导文件。

apiVersion: chainsaw.kyverno.io/v1alpha1

kind: Test

metadata:

  creationTimestamp: null

  name: instrumentation-java

spec:

  steps:

  - name: step-00

    try:

    - command:

        entrypoint: kubectl

        args:

        - annotate

        - namespace

        - ${NAMESPACE}

        - openshift.io/sa.scc.uid-range=1000/1000

        - --overwrite

    - command:

        entrypoint: kubectl

        args:

        - annotate

        - namespace

        - ${NAMESPACE}

        - openshift.io/sa.scc.supplemental-groups=3000/3000

        - --overwrite

    - apply:

        file: 00-install-collector.yaml

    - apply:

        file: 00-install-instrumentation-select.yaml

  - name: step-01

    try:

    - apply:

        file: 01-install-app-select.yaml

    - assert:

        file: 01-assert*.yaml

    catch:

      - podLogs:

          selector: app=my-java-select

tests/e2e-instrumentation/instrumentation-select

├── 00-install-collector.yaml

├── 00-install-instrumentation-select.yaml

├── 01-assert-select.yaml

├── 01-assert-without-select.yaml

├── 01-install-app-select.yaml

└── chainsaw-test.yaml

以我这里的这份文件为例，在其中定义了几个步骤：

初始化环境信息，包含创建 namespace
安装我们测试所需要的资源
- 00-install-collector.yaml：这里主要是安装一个 OpenTelemetry 的 collector
- 00-install-instrumentation-select.yaml：安装 Instrumentation 注入资源
- 01-install-app-select.yaml：应用一个我们需要测试的 deployment 资源
- 01-assert*.yaml：最后对最终生成的 yaml 资源与 assert*.yaml 的进行断言匹配，只有匹配成功后才能测试成功。

这里的测试目的主要是完成一个完整的 Java 应用的 deployment 注入 OpenTelemetry 的 agent 过程还有一些与 OpenTelemetry 相关的环境变量。

以 00-install-instrumentation-select.yaml 文件为例：

apiVersion: opentelemetry.io/v1alpha1

kind: Instrumentation

metadata:

  name: java-select

spec:

  selector:

    matchLabels:

      app: my-java-select

  env:

    - name: OTEL_TRACES_EXPORTER

      value: otlp

    - name: OTEL_EXPORTER_OTLP_ENDPOINT

      value: http://localhost:4317

  exporter:

    endpoint: http://localhost:4317

  propagators:

    - jaeger

    - b3

  sampler:

    type: parentbased_traceidratio

    argument: "0.25"

  java:

    env:

    - name: OTEL_JAVAAGENT_DEBUG

      value: "true"

它的预期效果是选择 app: my-java-select 的 deployment 将这些环境变量都注入进去，同时默认也会在 deployment 的容器中挂载一个 javaagent.jar:

ls /otel-auto-instrumentation-java/

javaagent.jar

而我们的 01-assert-select.yaml:

apiVersion: v1

kind: Pod

metadata:

  annotations:

    instrumentation.opentelemetry.io/inject-java: "true"

    sidecar.opentelemetry.io/inject: "true"

  labels:

    app: my-java-select

spec:

  containers:

  - env:

    - name: OTEL_JAVAAGENT_DEBUG

      value: "true"

    - name: JAVA_TOOL_OPTIONS

      value: ' -javaagent:/otel-auto-instrumentation-java/javaagent.jar'

    - name: OTEL_TRACES_EXPORTER

      value: otlp

    - name: OTEL_EXPORTER_OTLP_ENDPOINT

      value: http://localhost:4317

    - name: OTEL_TRACES_SAMPLER

      value: parentbased_traceidratio

    - name: OTEL_SERVICE_NAME

      value: my-java-select

    - name: OTEL_PROPAGATORS

      value: jaeger,b3

    - name: OTEL_RESOURCE_ATTRIBUTES

    name: myapp

  - args:

    - --config=env:OTEL_CONFIG

    name: otc-container

  initContainers:

  - name: opentelemetry-auto-instrumentation-java

status:

  containerStatuses:

  - name: myapp

    ready: true

    started: true

  initContainerStatuses:

  - name: opentelemetry-auto-instrumentation-java

    ready: true

  phase: Running

最终就是把实际的 deployment 的 yaml 内容和这份文件进行对比。

所以这个 e2e 测试就有点类似于集成测试，不会测试具体的功能函数，只需要最终结果能匹配就可以。

当然这个和单元测试也是相辅相成的，缺一不可，不能完全只依赖 e2e 测试，也有可能是概率原因导致最终生成的资源相同；单元测试可以保证函数功能与预期相同。

都准备好之后便可以进行测试了，测试的时候也很简单，只需要执行以下命令即可：

chainsaw test --test-dir ./tests/e2e-multi-instrumentation

这样它就会遍历该目录下的 chainsaw-test.yaml文件进行测试，执行我们上面定义的那些步骤，最终输出测试结果：

同时 Chainsaw 也提供了 Github action，可以方便的让我们和 github CI 进行集成。

jobs:

  example:

    runs-on: ubuntu-latest

    permissions: {}

    name: Install Chainsaw

    steps:

      - name: Install Chainsaw

        uses: kyverno/action-install-chainsaw@v0.1.0

        with:

          release: v0.0.9

      - name: Check install

        run: chainsaw version

这样我们就可以在 github 中查看我们的测试结果了：

总结

最后不得不感叹作为 CNCF 下面的项目 OpenTelemetry 的开发者体验真好，只要我们跟着贡献者文档一步步操作都能顺利通过 CI 测试，同时还能避免一些 Code Review 过程中的低级错误。

比如我第一次提 PR 的时候没有添加 changlog 文件，后面在贡献者手册里发现只需要执行 make chlog-new 就会基于当前分支信息帮我们生成一个 changelog 文件模板，然后只需要往里面填写内容即可。

这些工具链让不同开发者提交的代码和流程都符合规范，同时也降低了贡献难度。

以上所有的相关源码都可以在 https://github.com/open-telemetry/opentelemetry-operator 中进行查看。

参考链接：

自动化测试在 Kubernetes Operator 开发中的应用：以 OpenTelemetry 为例的更多相关文章

《Kubernetes Operator 开发进阶》- 作者絮絮叨
目录今天聊啥本书读者推荐序推荐序1 - 邓洪超推荐序2 - 任晶磊推荐语推荐语1 - 张磊推荐语2 - 宋净超推荐语3 - 王泽锋推荐语4 - 周鹏飞推荐语5 - 郑东旭本书简 ...
10个开发中常用的PHP代码样例
一.黑名单过滤 function is_spam($text, $file, $split = ':', $regex = false){ $handle = fopen($file, 'rb'); ...
Web开发中的18个关键性错误
前几年,我有机会能参与一些有趣的项目,并且独立完成开发.升级.重构以及新功能的开发等工作. 本文总结了一些PHP程序员在Web开发中经常忽略的关键错误,尤其是在处理中大型的项目上问题更为突出.典型的 ...
iOS 开发中的单例
在iOS开发中经常会用到单例,比如每个iOS程序本身就是一个单例,在比如进行个人偏好设置存储的时候用的也是一个单例.那我们如何自己来写一个单例类呢,用自己的单例对象呢?下面是我写的一个单例的头文件里的 ...
Kubernetes Operator基础入门
本文转自Rancher Labs 你是否曾经想过SRE团队是如何有效地成功管理复杂的应用?在Kubernetes生态系统中,Kubernetes Operator可以给你答案.在本文中,我们将研究Op ...
Kubernetes Operator: Operator
Operator 就可以看成是 CRD 和 Controller 的一种组合特例,Operator 是一种思想,它结合了特定领域知识并通过 CRD 机制扩展了 Kubernetes API 资源,使用 ...
TDD在Unity3D游戏项目开发中的实践
0x00 前言关于TDD测试驱动开发的文章已经有很多了,但是在游戏开发尤其是使用Unity3D开发游戏时,却听不到特别多关于TDD的声音.那么本文就来简单聊一聊TDD如何在U3D项目中使用以及如何使 ...
Java开发中的23种设计模式详解
[放弃了原文访问者模式的Demo,自己写了一个新使用场景的Demo,加上了自己的理解] [源码地址:https://github.com/leon66666/DesignPattern] 一.设计模式 ...
Java开发中的23种设计模式详解(转)
设计模式(Design Patterns) ——可复用面向对象软件的基础设计模式(Design pattern)是一套被反复使用.多数人知晓的.经过分类编目的.代码设计经验的总结.使用设计模式是为了 ...
java开发中的23中设计模式详解--大话设计模式
设计模式(Design Patterns) ——可复用面向对象软件的基础设计模式(Design pattern)是一套被反复使用.多数人知晓的.经过分类编目的.代码设计经验的总结.使用设计模式是为了 ...

随机推荐

nginx重新整理——————http请求的11个阶段中的content阶段[十八]
前言简单介绍一下content 阶段. 正文下面介绍一下root和alias. 这个前面其实就提交过了,这里再说明一下. 功能都是一样的:将url映射为文件路径,以返回静态文件内容. 差别:roo ...
redis 简单整理——客户端哨兵模式[三十]
前言简单介绍一下客户端的哨兵模式连接. 正文 Sentinel节点集合具备了监控.通知.自动故障转移.配置提供者若干功能,也就是说实际上最了解主节点信息的就是Sentinel节点集合, 而各个主 ...
docker 应用篇————docker安装[二]
前言这其实是去年的一篇blog,忘了写了.本来我想先发一下理论的,但是水平.... 正文如果你不熟悉linux,而是使用windows,那么你可以这样下载windows桌面版或者说你在这之前完全不 ...
重学c#系列——缓存[盛派源码分析cache](九)
前言以前整理过缓存的东西在: https://www.cnblogs.com/aoximin/p/12727659.html 只是粗略的例子,因为真的要去介绍缓存这个东西,要从内存开始,是一个有时间 ...
Elasticsearch数据同步优化
Elasticsearch数据同步优化背景为了满足项目需求,需要将大量数据的数据写入到ES进行检索,预估数据量是40亿左右,目前需要同步进去的是2亿左右. ES集群配置三台128G的国产服务器 ...
Django框架——路由分发、名称空间、虚拟环境、视图层三板斧、JsonResponse对象、request获取文件、FBV与CBV、CBV源码剖析、模版层
路由分发 # Django支持每个应用都可以有自己独立的路由层.静态文件.模版层.基于该特性多人开发项目就可以完全解耦合,之后利用路由分发还可以整合到一起多个应用都有很多路由与视图函数的对应关系这 ...
Dubbo 3.0 前瞻系列 | 2020双11，Dubbo3.0 在考拉的超大规模实践
很多开发者一直以来好奇:阿里自己有没有在用Dubbo,会不会用Dubbo?在刚刚结束的双11,我们了解到阿里云今年提出了"三位一体"的理念,即将"自研技术".& ...
滴滴 Flink-1.10 升级之路
简介: 滴滴实时计算引擎从 Flink-1.4 无缝升级到 Flink-1.10 版本,做到了完全对用户透明.并且在新版本的指标.调度.SQL 引擎等进行了一些优化,在性能和易用性上相较旧版本都有很大 ...
每次都需要解释大量指令？使用 PolarDB-X 向量化引擎
简介: 向量化引擎为PolarDB-X的表达式计算带来了显著的性能提升. 介绍 PolarDB-X是阿里巴巴自研的云原生分布式数据库,采用了计算-存储分离的架构,其中计算节点承担着大量的表达式计算任务 ...
[TP5] 浅谈 ThinkPHP 的 Hook 行为事件及监听执行
TP5 中使用 \think\Hook::add('xx', '\app\xxx\behavior\Xx') 注册行为. 也可以在 application/tags.php 中统一注册. 在需要监听执 ...

自动化测试在 Kubernetes Operator 开发中的应用：以 OpenTelemetry 为例

背景

安装

kind 使用

准备集群数据

e2e test

总结

自动化测试在 Kubernetes Operator 开发中的应用：以 OpenTelemetry 为例的更多相关文章

随机推荐

热门专题