本文分享自华为云社区《Cloudeye对接Prometheus实现华为云全方位监控》,作者:可以交个朋友 。

一、 背景

云眼系统Cloudeye服务为我们提供了针对弹性云服务器、宽带等资源的立体化监控平台。帮助我们全面了解华为云上的资源使用情况、业务的运行状况。将华为云Cloudeye服务接入 prometheus后,可以利用 Prometheus生态更好地监控和分析来自 Cloudeye服务的数据。

 

二、 简介

通过使用cloudeye-exporter,将华为云Cloudeye服务与华为云CCE集群(Kubernetes集群)中的Prometheus容器进行对接。继而使用Prometheus系统对云上资源的性能数据进行运维监控。

注意:该exporter仅适用于华为云局点。

三、实践演示

Prometheus将会以operator形式部署在kubernetes集群当中。所以也需要制作cloudeye-exporter容器镜像,然后容器化部署在kubernetes集群中。

3.1 获取cloudeye-exporter安装包

1、下载最新版本的cloudeye-exporter

查看插件Releases版本 (https://github.com/huaweicloud/cloudeye-exporter/releases) ,获取cloudeye-exporter下载地址,下载解压安装。

mkdir cloudeye-exporter & cd cloudeye-exporter

wget https://github.com/huaweicloud/cloudeye-exporter/releases/download/v2.0.6/cloudeye-exporter.v2.0.6.tar.gz

2、解压

tar -xzvf cloudeye-exporter.v2.0.6.tar.gz

 

3.2 制作容器镜像

1、需要编写Dockerfile文件 这里使用centos用作基础镜像

FROM centos
COPY cloudeye-exporter logs.yml metric.yml /root/
WORKDIR /root
CMD ["/root/cloudeye-exporter"]

2、构建容器镜像

docker build -t swr.cn-north-4.myhuaweicloud.com/k8s-solution/cloudeye-exporter:v2.0.6 --platform=linux/amd64 .

3、推送至镜像仓库

建议使用华为云SWR镜像仓库

3.3 配置cloudeye-exporter的访问鉴权

1、编辑clouds.yml文件配置公有云信息

cloudeye-exporter 启动时需要使用该配置文件进行云服务的访问鉴权

global:
port: ":8087" # 监听端口 :8087代表在全部网络接口上开启监听8087端口,限定内部访问也可以指定IP例如:192.168.1.100:8087
scrape_batch_size: 300
auth:
auth_url: "https://iam.cn-north-4.myhuaweicloud.com/v3"
project_name: "cn-north-4" # 华为云项目名称,可以在“华为云->统一身份认证服务->项目”中查看
access_key: "" # IAM用户访问密钥 您可参考3.1章节使用命令行输入加密后的ak sk,避免在配置文件中明文配置AK SK
secret_key: ""
region: "cn-north-4" # 区域ID

2、基于该配置文件创建kubernetes secrets

kubectl create secret generic clouds-exporter --from-file=clouds.yml -n monitoring
容器化部署需要将该配置以secrets形式挂载给cloudeye-exporter

3.4 CCE集群(k8s集群)部署cloudeye-exporter

1、首先部署负载和service

apiVersion: apps/v1
kind: Deployment
metadata:
name: cloudeye-exporter
namespace: monitoring
labels:
app: cloudeye-exporter
spec:
replicas: 1
selector:
matchLabels:
app: cloudeye-exporter
template:
metadata:
labels:
app: cloudeye-exporter
spec:
volumes:
- name: cloudeye
secret:
secretName: clouds-exporter
imagePullSecrets:
- name: default-secret
containers:
- name: cloudeye-exporter
image: swr.cn-north-4.myhuaweicloud.com/k8s-solution/cloudeye-exporter:v2.0.6
ports:
- containerPort: 8087
resources:
limits:
cpu: 500m
memory: 1Gi
requests:
cpu: 100m
memory: 500Mi
volumeMounts:
- name: cloudeye
mountPath: "/root/clouds.yml"
subPath: clouds.yml ---
apiVersion: v1
kind: Service
metadata:
name: cloudeye-exporter
namespace: monitoring
labels:
app: cloudeye-exporter
spec:
selector:
app: cloudeye-exporter
ports:
- name: ces
targetPort: 8087 #业务监听端口
port: 8087
protocol: TCP
type: ClusterIP
2、确认是cloudeye-exporter否暴露指标

部署成功,查看Pod信息。访问pod指标端点,确认指标源是否能暴露指标。

curl http://podIP:8087/metrics?services='SYS.VPC'


cloudeye-exporter Pod实例作为Prometheus抓取指标的源端,可以暴露监控数据。

查看Service,确认访问Service能否获取数据

2、注意

需要注意: 由于cloudeye-exporter需要访问公网端点: iam.huaweicloud.com。如果您使用的kuberntes平台是CCE turbo集群,需要对容器网段配置公网snat。否则指标数据抓取会失败。

3.5 Prometheus对接cloudeye-exporter获取指标

修改prometheus中的prometheus.yml文件配置。由于现在k8s集群中都会采用prometheus-operator形态部署Prometheus。所以我们需要编写ServiceMonitor进行指标的获取。

1、以监控华为云VPC,ELB服务为例

抓取规则cloudeye-exporter-servicemonitor.yaml 如下:

apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: cloudeye-exporter
namespace: monitoring
labels:
app: cloudeye-exporter
spec:
endpoints:
- interval: 1m
scrapeTimeout: 1m
port: ces
scheme: http
params:
services: ['SYS.VPC,SYS.ELB']
namespaceSelector:
matchNames:
- monitoring
selector:
matchLabels:
app: cloudeye-exporter

2、将上述抓取规则于集群中创建。等待片刻可观察到Prometheus已经成功抓取

3、至此,cloudeye-exporter成功接入Prometheus。

3.6 接入Grafana大盘

华为云社区提供了若干个云服务现成的dashborad。我们可以拿来使用。

https://github.com/huaweicloud/cloudeye-exporter/tree/v2.0.6/grafana_dashboard/templates

例如: 使用VPC云服务的dashboard。

1、将该dashboard的json文件上传到grafana中

选择好数据源后,点击导入即可。

2、发现异常

会发现dashboard并未产生数据

3、解决方式

根据华为云社区声明: 如果需要直接使用以下模板,需要修改prometheus配置,增加获取企业项目信息的任务。所以我们还需要修改servicemonitor,在原来cloudeye-exporter-servicemonitor的基础上增加一项配置

apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: cloudeye-exporter
namespace: monitoring
labels:
app: cloudeye-exporter
spec:
endpoints:
- interval: 1m
scrapeTimeout: 1m
port: ces
scheme: http
params:
services: ['SYS.VPC,SYS.ELB']
# 配置该任务获取企业项目信息,用于华为云云服务的dashboard
- interval: 1m
scrapeTimeout: 1m
port: ces
path: "/eps-info"
scheme: http
namespaceSelector:
matchNames:
- monitoring
selector:
matchLabels:
app: cloudeye-exporter

在集群中将上述指标抓取规则更新后,等待片刻后。

4、前往Prometheus页面可查看到,新的抓取任务已成功运行

5、再次观察Grafana

此时再前往Grafana前端查看dashboard: 华为云VPC云服务dashboard已成功展示

6、导入ELB grafana dashboard

华为云ELB监控信息也成功展示

四 、延伸扩展

目前已支持的Grafana Dashboard有:

  • 云搜索服务 CSS
  • 云专线 DCAAS
  • 分布式缓存服务 DCS
  • 弹性云服务器 ECS
  • 弹性负载均衡 ELB
  • 关系型数据库 RDS
  • Web应用防火墙 WAF
  • 弹性公网IP和带宽 VPC

点击关注,第一时间了解华为云新鲜技术~

Cloudeye对接Prometheus实现华为云全方位监控的更多相关文章

  1. 容器云平台监控告警体系(三)—— 使用Prometheus Operator部署并管理Prometheus Server

    1.概述 Prometheus Operator是一种基于Kubernetes的应用程序,用于管理Prometheus实例和相关的监控组件.它是由CoreOS开发的开源工具,旨在简化Prometheu ...

  2. Modbus的设备怎么对接华为云 使用金鸽BL100只需要5步

    BL100是一款高性价比的Modbus转MQTT网关支持一键对接阿里云.华为云. BL100将Modbus串口设备的数据上传至华为云只需要简单五步 第一步.首先将Modbus的设备通过RS485接上M ...

  3. 容器云平台监控告警体系(五)—— Prometheus发送告警机制

    1.概述 在Prometheus的架构中告警被划分为两个部分,在Prometheus Server中定义告警规则以及产生告警,Alertmanager组件则用于处理这些由Prometheus产生的告警 ...

  4. 重磅解读:K8s Cluster Autoscaler模块及对应华为云插件Deep Dive

    摘要:本文将解密K8s Cluster Autoscaler模块的架构和代码的Deep Dive,及K8s Cluster Autoscaler 华为云插件. 背景信息 基于业务团队(Cloud BU ...

  5. 为测试管理正名,华为云CodeArts TestPlan的守护之道

    摘要:华为云CodeArts TestPlan既有公有云版本,也有下沉到私有云的版本. 本文分享自华为云社区<为测试管理正名,华为云CodeArts TestPlan的守护之道>,作者:云 ...

  6. Cloud Native Weekly | 华为云抢先发布Redis5.0,红帽宣布收购混合云提供商 NooBaa

    1——华为云抢先发布Redis5.0 2——DigitalOcean K8s服务正式上线 3——红帽宣布收购混合云提供商 NooBaa 4——微软发布多项 Azure Kubernetes 服务更新 ...

  7. 详解华为云基因容器服务GCS

    基因测序,作为“下一个能够改变世界”的技术,已经由实验室研究演变到临床使用,为人类预测罹患多种疾病的可能性,提前预防和治疗疾病提供了一套可靠的方法和手段.而基于基因测序在预防和治疗疾病方面的准确和可靠 ...

  8. 华为云Volcano:让企业AI算力像火山一样爆发

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  9. 华为云ModelArts图深度学习,学习知识还能考取微认证

    作为人工智能最前沿的技术之一,图深度学习被公认是人工智能认识世界实现因果推理的关键,也是深度学习未来发展的方向.但深度学习对图数据模型的支持性差一直是众多研究者难以攻克的难点,因此图深度学习在实际生产 ...

  10. 华为云PaaS首席科学家:Cloud Native +AI,企业数字化转型的最佳拍档

    近日,在2019华为全球分析师大会期间,华为云PaaS首席科学家熊英博士在+智能,见未来(华为云&大数据)的分论坛上,从云计算行业发展谈起,深入云原生发展趋势,对华为云智能应用平台做了深度解读 ...

随机推荐

  1. 推荐一个react脚手架工具

    今天介绍一个react脚手架,react-cli, 可以说是 vue-cli 的外表,react的心! 安装步骤: npm install -g sao sao yang302/react-cli n ...

  2. 开源通用型流式大数据统计系统XL-LightHouse介绍

    概述 XL-LightHouse是针对互联网领域繁杂的流式数据统计需求而开发的一套集成了数据写入.数据运算.数据存储和数据可视化等一系列功能,支持大数据量,支持高并发的[通用型流式大数据统计平台]: ...

  3. Android 编译介绍

    一.需求 Android的源码非常的庞大,编译Android系统往往会占用我们很长的时间,我们需要了解下Android的编译规则,以期能提高我们的开发效率,达到程序员按时下班的伟大理想. 二.环境 平 ...

  4. Scrapy官方文档爬取

    最近想爬点啥东西看看, 所以接着学习了一点Scrapy, 学习过程中就试着去爬取Scrapy的官方文档作为练习之用, 现在已经基本完成了. 实现原理: 以 overview.html 为起点,通过 r ...

  5. 一文搞懂 OTP 双因素认证

    GitHub 在 2023 年 3 月推出了双因素认证(two-factor authentication)简称 2FA,并且承诺所有在 GitHub 上贡献的开发者在 2023 年底前启用双因素认证 ...

  6. Solution -「CF 392C」Yet Another Number Sequence

    Description Link. 求 \(\sum_{i=1}^{n}\text{fibonacci}_{i}\times i^{k}=\sum_{i=1}^{n}(F_{i-1}+\text{fi ...

  7. 【python】python开源代理ip池

    一.前言 随着互联网的不断发展,越来越多的应用需要使用高匿代理IP才能访问目标网站,而代理IP作为一种能够隐藏本机真实IP地址的工具,在网络抓取.搜索引擎排名.广告投放.反爬虫等方面有着广泛的应用场景 ...

  8. PLC通过Modbus转Profinet网关连接变频器控制电机案例

    在本案例中,通过使用Modbus转Profinet网关(XD-MDPN100),PLC可以通过Profinet协议与变频器进行通信和控制.这样,PLC可以实现对电机的转速调节.启停控制等功能. 同时, ...

  9. gitbook生成静态页面不跳转

    gitbook页面不跳转 现在可以在localhost:4000/查看自己的网页了.而且生成的网页存在_book文件夹中,下次点击 _book文件夹中的index.html就能打开网页,内容无更新,就 ...

  10. JUC并发编程(3)—锁中断机制

    目录 1.什么是中断 2.源码解读(中断的相关API) 3.如何使用中断标识停止线程 学习视频:https://www.bilibili.com/video/BV1ar4y1x727 1.什么是中断 ...