Prometheus-operator集群监控

github地址:https://github.com/prometheus-operator/kube-prometheus

具体的Prometheus是什么,为什么要用,什么时候用,还请移步本人其他随笔详细查看:https://www.cnblogs.com/v-fan/p/14057366.html

Prometheus-operator又是什么呢?

Prometheus-operator是专门用来监控k8s集群,并实现了一些自身特有的的自动化配置及管理,总得来说,就是使监控k8s集群更简单,更方便,由CoreOS率先引入其概念。

如下所示,是Prometheus Operator的架构示意图:

Prometheus Operator能做什么?

要了解Prometheus Operator能做什么,其实就是要了解Prometheus Operator为我们提供了哪些自定义的Kubernetes资源,列出了Prometheus Operator目前提供的️4类资源:

  1. Prometheus:声明式创建和管理Prometheus Server实例;
  2. ServiceMonitor:负责声明式的管理监控配置;
  3. PrometheusRule:负责声明式的管理告警配置;
  4. Alertmanager:声明式的创建和管理Alertmanager实例。

简单说,Prometheus Operator能够帮助用户自动化的创建以及管理Prometheus Server以及其相应的配置。

一、克隆项目到本地,进行服务构建

1、克隆

注意版本问题!!!页面明确指出分支所支持的kubernetes版本!!!

[root@Centos8 prome-git]# git clone https://github.com/prometheus-operator/kube-prometheus/tree/release-0.3
正克隆到 'kube-prometheus'...
remote: Enumerating objects: 9291, done.
remote: Total 9291 (delta 0), reused 0 (delta 0), pack-reused 9291
接收对象中: 100% (9291/9291), 5.09 MiB | 1.04 MiB/s, 完成.
处理 delta 中: 100% (5692/5692), 完成.

克隆到本地后,可以使用tree命令查看当前目录的树状结构

2、主要配置进行修改

cd kube-prometheus/manifests

## 主要的服务构建yaml文件全部在这里了
## 需要注意的是,要将:
Grafana-service.yaml
prometheus-service.yaml
alertmanager-service.yaml
## 三个svc的访问方式修改为NodePort模式,方便集群外的服务访问

vim grafana-service.yaml

apiVersion: v1
kind: Service
metadata:
labels:
app: grafana
name: grafana
namespace: monitoring
spec:
type: NodePort
ports:
- name: http
port: 3000
nodePort: 30201
targetPort: http
selector:
app: grafana

以下两个配置文件同样是修改此处,不再详细打印配置

vim prometheus-service.yaml

...

vim alertmanager-service.yaml

...

3、可以提前将要使用的镜像pull下来,使启动时更快

cd kube-prometheus/manifests 
for i in `awk -F ':' '/image:/{print $2":"$3}' *.yaml`;do docker pull ${i} ;done

4、开始创建yaml

## 先创建setup目录下的所有yaml,因为这是manifests/下yaml的基础
## setup中的yaml主要创建了自定义的namespace和crd(CustomResourceDefinition;自定义kind类型及api组和版本)
kubectl create -f manifests/setup ## 上一步执行成功后,可以查看自定义crd是否创建成功
[root@Centos8 manifests]# kubectl get crd
NAME CREATED AT
alertmanagers.monitoring.coreos.com 2020-11-10T08:19:16Z
podmonitors.monitoring.coreos.com 2020-11-10T08:19:17Z
prometheuses.monitoring.coreos.com 2020-11-10T08:19:17Z
prometheusrules.monitoring.coreos.com 2020-11-10T08:19:18Z
servicemonitors.monitoring.coreos.com 2020-11-10T08:19:18Z ## 查看自定义的kind:servicemonitors 创建是否成功
until kubectl get servicemonitors --all-namespaces ; do date; sleep 1; echo ""; done ## 开始创建Prometheus-operator资源
kubectl create -f manifests/

如果过程报错想删除,可以执行:kubectl delete --ignore-not-found=true -f manifests/ -f manifests/setup

5、检查是否启动完毕

kubectl get all -n monitoring

Pod全部Running正常后,通过svc开始访问grafana和prome即可

二、以上服务构建完成,通过grafana访问prome

1、访问prome:http://hub.vfancloud.com:30202

2、访问grafana:http://hub.vfancloud.com:30201  

默认账号密码:admin/admin

具体资源的使用情况可以点进模板自行查看:

需要注意:此搭建全部是引用了Prometheus-operator的默认监控配置,如果有自定义需求,完全可以自己修改yaml文件中的values等信息;设置告警途径等。

Kubernetes-19:Prometheus-operator集群监控神器的更多相关文章

  1. 理解OpenShift(7):基于 Prometheus 的集群监控

    理解OpenShift(1):网络之 Router 和 Route 理解OpenShift(2):网络之 DNS(域名服务) 理解OpenShift(3):网络之 SDN 理解OpenShift(4) ...

  2. Kubernetes 1.26.0 集群部署Prometheus监控

    前言 该存储库收集 Kubernetes 清单.Grafana仪表板和Prometheus 规则,结合文档和脚本,使用Prometheus Operator提供易于操作的端到端 Kubernetes ...

  3. 重磅!容器集群监控利器 阿里云Prometheus 正式免费公测

    Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架.它启发于 Google 的 borgmon 监控系统,并于 2015 年正式发布.2016 年,Prometheu ...

  4. 049.Kubernetes集群管理-集群监控Metrics

    一 集群监控 1.1 Metrics Kubernetes的早期版本依靠Heapster来实现完整的性能数据采集和监控功能,Kubernetes从1.8版本开始,性能数据开始以Metrics API的 ...

  5. vivo 容器集群监控系统架构与实践

    vivo 互联网服务器团队-YuanPeng 一.概述 从容器技术的推广以及 Kubernetes成为容器调度管理领域的事实标准开始,云原生的理念和技术架构体系逐渐在生产环境中得到了越来越广泛的应用实 ...

  6. 一文读懂clickhouse集群监控

    更多精彩内容,请关注微信公众号:后端技术小屋 一文读懂clickhouse集群监控 常言道,兵马未至,粮草先行,在clickhouse上生产环境之前,我们就得制定好相关的监控方案,包括metric采集 ...

  7. 分布式协调服务Zookeeper集群监控JMX和ZkWeb应用对比

    分布式协调服务Zookeeper集群监控JMX和ZkWeb应用对比 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. JMX是用来远程监控Java应用的框架,这个也可以用来监控其他的J ...

  8. kafka集群监控之kafka-manager部署(kafka-manager的进程为:ProdServerStart)

    kafka集群监控之kafka-manager部署(ProdServerStart) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 雅虎官网GitHub项目:https://git ...

  9. SpringCloud (十) Hystrix Dashboard单体监控、集群监控、与消息代理结合

    一.前言 Dashboard又称为仪表盘,是用来监控项目的执行情况的,本文旨在Dashboard的使用 分别为单体监控.集群监控.与消息代理结合. 代码请戳我的github 二.快速入门 新建一个Sp ...

  10. 使用国内的镜像源搭建 kubernetes(k8s)集群

    1. 概述 老话说的好:努力学习,提高自己,让自己知道的比别人多,了解的别人多. 言归正传,之前我们聊了 Docker,随着业务的不断扩大,Docker 容器不断增多,物理机也不断增多,此时我们会发现 ...

随机推荐

  1. 国产化率100%!全志科技A40i工业核心板规格书资料分享

    1.核心板简介 创龙科技SOM-TLA40i是一款基于全志科技A40i处理器设计的4核ARM Cortex-A7国产工业核心板,每核主频高达1.2GHz. 核心板通过邮票孔连接方式引出CSI.TVIN ...

  2. 移动web布局方法

    继续更新移动端的一个布局,这也是经典中的经典,当初只知道个rem和vwvh适配,其实这里面还有很多的门道不只是一个适配这么简单 一.前置 1.背景缩放 我们都知道做移动端,给的图都是二倍图,你拿来用直 ...

  3. UG二次开发 PYTHON 环境配置

    NX 二次开发 PYTHON VSCODE 环境配置 我电脑上装的是WIN11 NX1988 在电脑的UG的安装文件夹内找到 python 一般在 xx\NXBIN 在所在的文件夹内,运行python ...

  4. 羊城杯初赛部分misc

    羊城杯初赛部分misc Ez_misc i春秋刚考过的CVE,win11截图漏洞CVE-2023-21036(acropalypse) https://github.com/frankthetank- ...

  5. VulnHub_DC-5渗透流程

    DC-5 主机探测 nmap 192.168.157.0/24 访问网站 探测网站得知是Nginx 目录扫描 在Contact处可以提交东西,抓个包,发现在thankyou.php界面时间年份会变,应 ...

  6. 原创软件 | 系统服务工具箱原创软件(587KB)--基于aardio开发的第一个程序

    1 系统服务工具箱简介 该软件是我使用aardio开发的第一个程序,它集成了多个系统常用的快捷键,无需记住各种命令就能快捷使用cmd管理员.计算机管理.控制面板.组策略.注册表.服务.任务管理.卸载程 ...

  7. 转载 | ofd转pdf最好用的软件,ofd文件如何转化成pdf?

    1.背景 需要将ofd转换为pdf 2.使用方法 使用taurusxin 开发的软件Ofd2Pdf.exe即可实现,软件版权归原作者所有.这里表示感谢! 3.下载地址 官网:https://githu ...

  8. 2024秋招字节跳动朝夕光年UE4客户端开发实习生岗笔试题目

    20240117更新 2024年秋招笔试题目,没想到时隔几个月字节跳动游戏业务就要寄了,本文仅供参考,请大佬多多指教 Q1字符串处理 Q2 杯子问题 桌子上有4109+1个饮料杯,这些饮料杯的编号依次 ...

  9. Vscode 一次选中多行 光标一次定位多行

    1 . 鼠标点击开始位置(定位到行首时,鼠标就点击第一行的行首:定位到行尾时,鼠标就点击第一行的行尾:) 2.  按住shift+alt 点击结束的位置(定位到行首时,鼠标就点击最后一行的行首:定位到 ...

  10. Geostudio简单实现边坡安全系数的计算

    Geostudio是加拿大团队开发的用于岩土工程稳定性分析的一款工程软件,里面的安全系数的计算基本都是基于极限平衡法原理进行求解的,SLOPE/W模块用于安全系数的求解.SEEP/W模块考虑渗水作用. ...