本文分享自华为云社区《Promethues-operator入门使用指导》，作者：可以交个朋友。

一、背景

在非operator配置的普罗中我们监控k8s集群都是通过配置configmap进行服务发现和指标拉取。切换到prometheus-operator难免会有些使用问题。不少用户已经习惯底层配置自动发现的方式。当过渡到servicemonitor或者podmonitor或多或少不习惯。所以下面就为大家介绍一下Prometheus-Operator，以及servicemonitor的使用方法

二、 Prometheus-Operator介绍

Prometheus Operator 为 Kubernetes 提供了对 Prometheus 相关监控组件的本地部署和管理方案，该项目的目的是为了简化和自动化基于 Prometheus 的监控栈配置，主要包括以下几个功能：

kubernetes自定义资源：使用kubernetes CRD 来部署和管理Prometheus，Alertmanager和相关组件
简化的部署配置：直接通过kubernetes资源清单配置Prometheus,比如版本，持久化，副本，保留策略等等配置
Prometheus监控目标配置：基于熟知的kubernetes标签查询自动生成监控目标配置，无需学习prometheus特地的配置

2.1 架构

下图是 Prometheus-Operator 官方提供的架构图，各组件以不同的方式运行在 Kubernetes 集群中，其中 Operator 是最核心的部分，作为一个控制器，它会去创建 Prometheus、ServiceMonitor、AlertManager以及 PrometheusRule 等 CRD 资源对象，然后会一直 Watch 并维持这些资源对象的状态。

下面三个yaml文件很好的表述了，prometheus 如何关联选择 servicemonitor，servicemonitor 如何关联选择目标service。

为了能让prom监控k8s内的应用，Prometheus-Operator通过配置servicemonitor匹配到由service对象自动填充的Endpoints，并配置prometheus监控这些Endpoints后端的pods，ServiceMonitor.Spec的Endpoints部分就是用于配置Endpoints的哪些端口将被scrape指标。

servicemonitor对象很巧妙，它解耦了“监控的需求”和“需求的实现方”。servicemonitor 只需要用到label-selector 这种简单又通用的方式声明一个 “监控需求”，也就是哪些Endpoints 需要搜集，怎么收集就行了。让用户只关心需求，这是一个非常好的关注点分离。当然servicemonitor 最后还是会被operator转化为原始的复杂的scrape config,但这个复杂度已经完全被operator屏蔽了。

下图很好的展现了prometheus在配置报警时需要操作哪些资源，及各资源起到的作用

首先通过配置servicemonitor/podmonitor来获取应用的监控指标；

Prometheus.spec.alerting字段会匹配Alertmanager中的配置，匹配到alertmanager实例

然后通过prometheusrule对监控到的指标配置报警规则；

最后配置告警接收器，配置alertmanagerconfig来配置如何处理告警，包括如何接收、路由、抑制和发送警报等；

2.2 常见CRD

Prometheus，定义了所需的 Prometheus 部署。

ServiceMonitor，以声明方式指定应如何监控 Kubernetes 服务组。Operator 根据 API 服务器中对象的当前状态自动生成 Prometheus 抓取配置。

PodMonitor，以声明方式指定应如何监控 pod 组。Operator 根据 API 服务器中对象的当前状态自动生成 Prometheus 抓取配置。

PrometheusRule，定义了一组所需的 Prometheus 警报和/或记录规则。Operator 生成一个规则文件，可供 Prometheus 实例使用。

Alertmanager，定义了所需的 Alertmanager 部署。

AlertmanagerConfig，以声明方式指定 Alertmanager 配置的子部分，允许将警报路由到自定义接收器并设置禁止规则。

Probe，以声明方式指定应如何监视入口组或静态目标。Operator 根据定义自动生成 Prometheus scrape 配置。配合blackbox exporter使用。

ThanosRuler，定义了所需的 Thanos Ruler 部署。

三、 Prometheus-Operator安装

Prometheus-Operator对K8S集群的版本有要求，请参照集群版本选择对应Prometheus-Operator版本代码库：https://github.com/prometheus-operator/kube-prometheus

本文档所用环境为1.25k8s集群对应0.12.0版本https://github.com/prometheus-operator/kube-prometheus/archive/refs/heads/release-0.12.zip

3.1 安装

    wget https://github.com/prometheus-operator/kube-prometheus/archive/refs/heads/release-0.12.zip

    unzip release-0.12.zip

    cd kube-prometheus-release-0.12

    kubectl apply --server-side -f manifests/setup

    kubectl wait \

    --for condition=Established \

    --all CustomResourceDefinition \

    --namespace=monitoring

    kubectl apply -f manifests/

#注意：kube-state-metrics和prometheus-adapter的镜像为谷歌官方库的镜像，国内可能存在拉取不到的问题，如果由于镜像拉取不到导致pod pending，请将其替换成可获取到的镜像地址。

3.2 卸载

注意：此步骤为卸载步骤，如果想继续保留Prometheus-Operator，请不要执行此步骤kubectl delete --ignore-not-found=true -f manifests/ -f manifests/setup

四、使用servicemonitor监控应用暴露的指标

创建deployment对象和service资源，该服务8080端口会暴露自身指标。

apiVersion: apps/v1

kind: Deployment

metadata:

  labels:

    app: sample-metrics-app

  name: sample-metrics-app

spec:

  replicas: 2

  selector:

    matchLabels:

      app: sample-metrics-app

  template:

    metadata:

      labels:

        app: sample-metrics-app

    spec:

      tolerations:

      - key: beta.kubernetes.io/arch

        value: arm

        effect: NoSchedule

      - key: beta.kubernetes.io/arch

        value: arm64

        effect: NoSchedule

      - key: node.alpha.kubernetes.io/unreachable

        operator: Exists

        effect: NoExecute

        tolerationSeconds: 0

      - key: node.alpha.kubernetes.io/notReady

        operator: Exists

        effect: NoExecute

        tolerationSeconds: 0

      containers:

      - image: luxas/autoscale-demo:v0.1.2

        name: sample-metrics-app

        ports:

        - name: web

          containerPort: 8080

        readinessProbe:

          httpGet:

            path: /

            port: 8080

          initialDelaySeconds: 3

          periodSeconds: 5

        livenessProbe:

          httpGet:

            path: /

            port: 8080

          initialDelaySeconds: 3

          periodSeconds: 5

---

apiVersion: v1

kind: Service

metadata:

  name: sample-metrics-app

  labels:

    app: sample-metrics-app

spec:

  ports:

  - name: web

    port: 80

    targetPort: 8080

  selector:

    app: sample-metrics-app

创建servicemonitor对象采集应用指标

apiVersion: monitoring.coreos.com/v1

kind: ServiceMonitor

metadata:

  name: sample-metrics-app

  labels:

    service-monitor: sample-metrics-app

spec:

  selector:

    matchLabels:

      app: sample-metrics-app  # 匹配标签为app：sample-metrics-app的service

  endpoints:

  - port: web  #Promethues采集指标的端口为service中portName表示的端口

查看新建的service，在集群内节点上通过service IP访问应用kubectl get service

通过访问service IP的metrics接口可以查看到应用暴露的指标curl 10.247.227.116/metrics

可以看到，应用暴露的指标是 “http_requests_total” ，且监控采集到的数量是805

浏览器访问Prometheus UI界面查看指标通过IP和端口访问prometheus-server，查看servermonitor及指标监控情况

可以看到应用暴露的指标已成功采集，由于指标采集时间间隔的原因，prometheus采集的指标数为800，而应用的metrics接口暴露出的数量为805。

点击关注，第一时间了解华为云新鲜技术~

教你使用Prometheus-Operator进行K8s集群监控的更多相关文章

prometheus operator（Kubernetes 集群监控）
一.Prometheus Operator 介绍 Prometheus Operator 是 CoreOS 开发的基于 Prometheus 的 Kubernetes 监控方案,也可能是目前功能最全面 ...
教你用multipass快速搭建k8s集群
目录前言一.multipass快速入门安装使用二.使用multipass搭建k8s集群创建3台虚拟机安装master节点安装node节点测试k8s集群三.其他问题不能拉取镜像:报 ...
性能测试：k8s集群监控环境搭建（kube-prometheus）
选择kube-prometheus版本 k8s集群版本是1.22.x 5个节点说明:如果你电脑配置低,也可以1个master节点,2个node节点 3个节点 Kube-Prometheus地址:ht ...
k8s集群监控 cadvisor/exporter+prometheus+grafana
### k8s监控处理 ### 1.cadvisor/exporter+prometheus+grafana 安装#### 1.1 配置nfs安装```shellubuntu: nfs 服务器 apt ...
k8s集群监控（十一）--技术流ken
Weave Scope 在我之前的docker监控中<Docker容器监控(十)--技术流ken>就已经提到了weave scope. Weave Scope 是 Docker 和 K ...
k8s集群监控（十一）
Weave Scope 在我之前的docker监控中<Docker容器监控(十)–技术流ken>就已经提到了weave scope. Weave Scope 是 Docker 和 Ku ...
【集群监控】Docker上部署Prometheus+Alertmanager+Grafana实现集群监控
Docker部署下载 sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.re ...
部署k8s集群监控Heapster
git clone https://github.com/kubernetes/heapster.gitkubectl apply -f heapster/deploy/kube-config/inf ...
Kubernetes(k8s)集群部署（k8s企业级Docker容器集群管理）系列目录
0.目录整体架构目录:ASP.NET Core分布式项目实战-目录 k8s架构目录:Kubernetes(k8s)集群部署(k8s企业级Docker容器集群管理)系列目录一.感谢在此感谢.net ...
基于prometheus监控k8s集群
本文建立在你已经会安装prometheus服务的基础之上,如果你还不会安装,请参考:prometheus多维度监控容器如果你还没有安装库k8s集群,情参考: 从零开始搭建基于calico的kuben ...

随机推荐

Java将MySQL建表语句转换为SQLite的建表语句
Java将MySQL建表语句转换为SQLite的建表语句源代码: package com.fxsen.platform.core.util; import java.util.HashMap; im ...
图解Spark Graphx实现顶点关联邻接顶点的函数原理
一.场景案例在一张社区网络里,可能需要查询出各个顶点邻接关联的顶点集合,类似查询某个人关系比较近的都有哪些人的场景. 在用Spark graphx中,通过函数collectNeighbors便可以获 ...
springboot下载文件范围下载
springboot下载文件范围下载关键词:springboot,download,Range,Content-Range,Content-Length,http code 206 Partial ...
HTML一键打包IPA（苹果IOS应用）工具网站打包 APP
工具简介 HTML一键打包IPA(苹果应用)工具可以把本地HTML项目或者网站打包为一个苹果应用IPA文件,无需编写任何代码,支持在苹果设备上安装运行. 该软件已经被GDB苹果网页一键打包工具取代,详 ...
CVE-2018-8120 漏洞复现
CVE-2018-8120 漏洞复现漏洞描述 win32k.sys中函数 SetImeInfoEx未对指针进行合法性检查,从而导致一个任意地址写. 漏洞分析漏洞成因 int __stdcall S ...
【Python爬虫】python打印本地代理
在进行网络爬虫时,使用代理是非常重要的.因为爬虫经常会被网站封 IP,而代理可以隐藏你的真实 IP 地址,让你可以更不受限制地爬取数据.本文将介绍如何在 Python 中打印代理,包括代理 IP 的使 ...
C++ 转换构造函数
在 C++ 中如果一个构造函数只有一个参数,那么这个构造函数就是转换构造函数(Converting Constructor),这个构造函数可以将参数类型转换成构造函数所在的类对应的类型. 举个例子,假 ...
C#使用iKvm黑科技无缝接入JVM生态
前言时间过得飞快,一转眼国庆假期也要过去了,再不更新博客就太咸鱼了-- 最近在开发AIHub的时候想找个C#能用的命名实体识别库,但一直没找到,AI生态方面C#确实不太丰富,这块还是得Python, ...
Git——Git 常用命令
文章目录仓库配置增加/删除文件代码提交分支标签查看信息远程同步撤销其他仓库 # 在当前目录新建一个Git代码库 $ git init # 新建一个目录,将其初始化为Git代码库 ...
chatgpt与搜索结合，百度会在这股浪潮下掘金吗？
年末,在百度内部沟通会上,百度创始人李彦宏提到最近他的朋友们问他如何看待ChatGPT,包括他周围同行业中的同一领域和跨境人士. 事实上,早在ChatGPT将他的对话能力和直观的互动方式展现给全世界 ...

教你使用Prometheus-Operator进行K8s集群监控

一、 背景