Prometheus常用exporter及其常用监控指标
node-exporter常用监控指标
- CPU相关指标:
node_cpu_seconds_total{mode="idle"}:CPU空闲时间(秒)的总和。这是评估CPU使用率的重要指标之一。node_cpu_seconds_total{mode="system"}、node_cpu_seconds_total{mode="user"}等:分别表示CPU在内核态和用户态的运行时间。
- 内存相关指标:
node_memory_MemTotal_bytes:内存总量(以字节为单位)。node_memory_MemFree_bytes:空闲内存大小(以字节为单位)。node_memory_Buffers_bytes和node_memory_Cached_bytes:分别表示被内核用作缓冲和缓存的内存大小。node_memory_SwapTotal_bytes和node_memory_SwapFree_bytes:分别表示交换空间的总大小和空闲大小。
- 磁盘相关指标:
node_filesystem_size_bytes:文件系统的大小(以字节为单位)。node_filesystem_free_bytes和node_filesystem_avail_bytes:分别表示文件系统的空闲空间和非root用户可用的空间大小。node_disk_io_now、node_disk_io_time_seconds_total等:与磁盘I/O操作相关的指标,如当前正在进行的I/O操作数以及花费在I/O操作上的总时间。
- 网络相关指标:
node_network_receive_bytes_total和node_network_transmit_bytes_total:分别表示网络接口接收和发送的总字节数。这些指标对于评估网络流量和带宽使用情况非常重要。
- 系统负载相关指标:
node_load1、node_load5、node_load15:分别表示系统在过去1分钟、5分钟和15分钟的平均负载。这些指标有助于了解系统的整体忙碌程度和性能表现。
要获取完整的指标列表,可以访问 node-exporter 的 metrics 端点(通常是 /metrics)。
mysql-exporter常用监控指标:
- MySQL 全局状态指标:
mysql_global_status_uptime:MySQL 服务器的运行时间(以秒为单位)。mysql_global_status_threads_connected:当前打开的连接数。mysql_global_status_threads_running:当前正在运行的线程数。mysql_global_status_queries:从服务器启动开始执行的查询总数。mysql_global_status_questions:从服务器启动开始接收的客户端查询总数。
- MySQL 复制指标(如果配置了复制):
mysql_slave_status_slave_io_running:表示 IO 线程是否正在运行(1 为运行,0 为停止)。mysql_slave_status_slave_sql_running:表示 SQL 线程是否正在运行(1 为运行,0 为停止)。mysql_slave_status_seconds_behind_master:从服务器相对于主服务器的延迟时间(以秒为单位)。
- InnoDB 存储引擎指标:
mysql_global_status_innodb_buffer_pool_read_requests:InnoDB 缓冲池执行的逻辑读请求数。mysql_global_status_innodb_buffer_pool_reads:不能满足 InnoDB 缓冲池而直接从磁盘读取的请求数。mysql_global_status_innodb_row_lock_time_avg:平均行锁定时间(以毫秒为单位)。mysql_global_status_innodb_row_lock_time_max:最大行锁定时间(以毫秒为单位)。
- 连接和资源使用指标:
mysql_global_variables_max_connections:MySQL 配置的最大连接数。mysql_global_status_aborted_connects:尝试连接到 MySQL 服务器但失败的连接数。mysql_global_status_connection_errors_total:由于各种原因导致的连接错误总数。
- 查询缓存指标(如果启用了查询缓存):
mysql_global_status_qcache_hits:查询缓存命中次数。mysql_global_status_qcache_inserts:插入到查询缓存中的查询次数。mysql_global_status_qcache_not_cached:由于查询类型或其他原因而无法缓存的查询次数。
- 其他常用指标:
mysql_exporter_last_scrape_duration_seconds:mysql-exporter上次抓取指标所花费的时间。mysql_exporter_scrape_errors_total:mysql-exporter在抓取过程中遇到的错误总数。
要获取完整的指标列表,可以访问 mysql-exporter 的 metrics 端点(通常是 /metrics)。此外,对于特定的监控需求,可能还需要结合 MySQL 的性能和配置进行进一步的定制和选择。
redis-exporter 常用监控指标
- Redis 连接相关指标:
redis_connected_clients:当前连接的 Redis 客户端数量。redis_connected_slaves:当前连接的 Redis 从节点数量。redis_blocked_clients:正在等待 Redis 的客户端数量(通常因为 BLPOP、BRPOP、BRPOPLPUSH 等命令阻塞)。
- Redis 性能相关指标:
redis_instantaneous_ops_per_sec:每秒执行的操作数,反映 Redis 的处理速度。redis_latency_spike_duration_seconds:最近一次延迟峰值持续了多长时间(秒),这是检测性能问题的一个标志。
- 内存使用相关指标:
redis_mem_used_bytes:Redis 使用的内存大小(字节)。redis_mem_fragmentation_ratio:内存碎片率,当该值远大于 1 时,表示存在较多的内存碎片。redis_evicted_keys_total:由于 maxmemory 限制而被淘汰的 key 的总数量。redis_expired_keys_total:已过期的 key 的总数量。
- 持久性相关指标:
redis_rdb_last_save_time_seconds:自从 Redis 服务器启动以来,最后一次 RDB 持久化的 UNIX 时间戳。redis_rdb_changes_since_last_save:自从最后一次 RDB 持久化以来,数据库发生的改变次数。redis_aof_current_size_bytes:当前 AOF 文件的大小(字节)。redis_aof_last_rewrite_time_seconds:上一次 AOF 重写操作的耗时(秒)。
- 其他常用指标:
redis_uptime_in_seconds:Redis 自启动以来的运行时间(秒)。redis_keyspace_hits_total和redis_keyspace_misses_total:键空间命中和未命中的总数,这些可以帮助了解缓存的效率。
blackbox-exporter 常用监控指标
- HTTP指标:
http_status_code:HTTP响应状态码,如200、404、500等。http_content_length:HTTP响应内容长度。http_request_duration_seconds:HTTP请求延迟。http_ssl_expiry_seconds:HTTPS证书过期时间。
- DNS指标:
dns_lookup_time_seconds:DNS查询时间。dns_lookup_error:DNS查询是否出错。
- TCP指标:
tcp_connect_time_seconds:TCP连接时间。tcp_connection_refused:TCP连接是否被拒绝。
- ICMP指标:
icmp_response:ICMP响应是否正常,通常用于检测远程主机是否在线(存活状态)。
Spring Boot Actuator 常用监控指标
Spring Boot Actuator是一个用于暴露应用程序自身信息的模块,它可以提供一系列生产就绪的端点,这些端点可以用于监视和管理Spring Boot应用程序。通过Actuator,您可以轻松地获取应用程序的运行时信息,如健康状态、性能指标、环境属性、系统属性等。
以下是一些常见的可以通过 /actuator/prometheus 监控的指标类型:
- 系统指标:
- CPU 使用率
- 内存使用情况(堆内存、非堆内存、JVM内存池等)
- 系统负载
- 磁盘空间和使用情况
- 网络I/O
- 文件描述符使用
- 线程状态和数量
- 垃圾回收活动
- 应用指标:
- HTTP 请求的计数、速率、延迟和百分位数
- 数据库连接的池使用情况、查询次数和性能
- 消息队列的消费和生产速率
- 缓存命中率、大小和驱逐次数
- 调度任务的执行情况和延迟
- 外部API调用的次数、失败率和延迟
- 业务指标:
- 用户注册、登录和会话数
- 订单处理速率和失败率
- 购物车放弃率
- 页面浏览量和跳出率
- 任何与你的业务逻辑直接相关的自定义指标
- 健康指标:
- 数据库连接健康状态
- 外部服务可达性(如API网关、认证服务等)
- 磁盘空间不足警告
- 应用程序内部特定组件的健康检查(如缓存服务、消息队列等)
- 自定义指标:
- 你可以定义自己的度量来监控应用程序中任何重要的方面。
Prometheus常用exporter及其常用监控指标的更多相关文章
- 【0.2】【MySQL】常用监控指标及监控方法(转)
[MySQL]常用监控指标及监控方法 转自:https://www.cnblogs.com/wwcom123/p/10759494.html 对之前生产中使用过的MySQL数据库监控指标做个小结. ...
- 【MySQL】常用监控指标及监控方法
对之前生产中使用过的MySQL数据库监控指标做个小结. 指标分类 指标名称 指标说明 性能类指标 QPS 数据库每秒处理的请求数量 TPS 数据库每秒处理的事务数量 并发数 数据库实例当前并行处理的 ...
- prometheus自定义监控指标——实战
上一节介绍了pushgateway的作用.优劣以及部署使用,本机通过几个实例来重温一下自定义监控指标是如何使用的. 一.监控容器启动时间(shell) 使用prometheus已经两个月了,但从未找到 ...
- prometheus自定义监控指标——入门
grafana结合prometheus提供了大量的模板,虽然这些模板几乎监控到了常见的监控指标,但是有些特殊的指标还是没能提供(也可能是我没找到指标名称).受zabbix的影响,自然而然想到了自定义监 ...
- Node Exporter监控指标
访问http://localhost:9100/metrics,可以看到当前node exporter获取到的当前主机的所有监控数据,如下所示: 每一个监控指标之前都会有一段类似于如下形式的信息: # ...
- Prometheus【node_exporter】+grafana监控云主机
下面说一下这个开源软件的安装实践过程,目标如下: 在监控服务器上安装prometheus 在被监控环境上安装exporter 安装grafana 在监控服务器上安装prometheus 开始安装pro ...
- Spring Boot如何自定义监控指标
1.创建项目 pom.xml引入相关依赖 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi=" ...
- Hadoop记录- zookeeper 监控指标
目前zookeeper获取监控指标已知的有两种方式: 1.通过zookeeper自带的 four letter words command 获取各种各样的监控指标 2.通过JMX Client连接zo ...
- MySQL 监控指标
为了排查问题,对数据库的监控是必不可少的,在此介绍下 MySQL 中的常用监控指标. 简介 MySQL 有多个分支版本,常见的有 MySQL.Percona.MariaDB,各个版本所对应的监控项也会 ...
- Prometheus基于consul自动发现监控对象 https://www.iloxp.com/archive/11/
Prometheus 监控目标为什么要自动发现 频繁对Prometheus配置文件进行修改,无疑给运维人员带来很大的负担,还有可能直接变成一个“配置小王子”,即使是配置小王子也会存在人为失误的情况 ...
随机推荐
- [XXL-JOB] 项目集成-Framework
1.导入pom坐标 <dependency> <groupId>com.hbasesoft.framework</groupId> <artifactId&g ...
- dropzone基本使用
dropzone是一个实现拖拽上传文件的一个插件. 生成拖拽区域 1 <div style="width: 1078px;margin: 0 auto;border: 2px ligh ...
- Linux系统NTP配置同步修改硬件时钟
前言: 硬件时钟:即BIOS时间,就是CMOS设置时看到的时间,存储在主板BIOS里,关机及断电后由主板电池供电维持时间的守时. 系统时钟:linux系统Kernel时间,由CPU守时,关机及断 ...
- 2000元内最超值游戏处理器!锐龙5 7500F首发评测:轻松超频5.6GHz游戏追平i5-13600K
一.前言:首款不带核显的锐龙7000处理器 以往的桌面锐龙处理器,带核显型号的很少,而到了Zen4时代,此前已上市的锐龙7000系列处理器都集成了核显. 现在,AMD锐龙5 7500F来了,这是AMD ...
- 19c RAC 告警日志报错 ORA 7445 [pevm_icd_call_common()+225]
问题现象: 在一套2节点的19c RAC 环境下,节点2 alert告警 ORA 7445,且频度固定为每分钟报一次:期间有重启实例,但故障依旧: ========================== ...
- 小知识:后台执行Oracle创建索引免受会话中断影响
因为客户环境的堡垒机经常会莫名的断开连接,也不是简单的超时,因为有时候即使你一直在操作,也可能会断. 这样对于操作一些耗时长且中途中断可能会导致异常的操作就很危险,而最简单的避免方法就是将其写到脚本中 ...
- .NET Core开发实战(第31课:APIController:定义API的最佳实践)--学习笔记
31 | APIController:定义API的最佳实践 首先看一个传统意义上三层架构定义的 Controller [HttpPost] public Task<long> Create ...
- 零基础入门Vue之拘元遣将——其他常用指令&自定义指令
回首 在 零基础入门Vue之梦开始的地方--插值语法 我记录了v-bind.v-on.v-model的学习 在 零基础入门Vue之To be or not to be--条件渲染 我记录了v-if.v ...
- sensitive-word 敏感词/脏词开源工具-v.0.10.0-脏词分类标签支持
sensitive-word sensitive-word 基于 DFA 算法实现的高性能敏感词工具. 创作目的 实现一款好用敏感词工具. 基于 DFA 算法实现,目前敏感词库内容收录 6W+(源文件 ...
- 【Unity3D】IK动画
1 IK简介 2D动画.人体模型及动画.人物跟随鼠标位置中介绍了 Aniamtion.Animator.人体模型.人体骨骼.人体动画等基础知识及人体动画的应用,本文将进一步介绍 IK 动画. ...