官方文档地址:http://docs.minio.org.cn/docs/master/minio-monitoring-guide

MinIO服务器通过端点公开监视数据。监视工具可以从这些端点中选择数据。

健康检查探针

MinIO服务器具有两个与运行状况检查相关的未经身份验证的端点,一个活动性探针(指示服务器是否工作正常),一个就绪性探针(指示服务器是否由于重负载而未接受连接)。

  • 活力探针: /minio/health/live
  • 就绪探针: /minio/health/ready

Prometheus 探测

MinIO服务器在单个端点上公开与Prometheus兼容的数据。默认情况下,对端点进行身份验证。

  • Prometheus 数据可在 /minio/prometheus/metrics

要使用此端点,请设置Prometheus以从该端点抓取数据。

使用Prometheus监控MinIO服务器

MinIO默认情况下将Prometheus兼容数据作为授权端点导出/minio/prometheus/metrics。希望监视其MinIO实例的用户可以指向Prometheus配置,以从该终结点抓取数据。

为Prometheus指标配置身份验证类型

MinIO支持Prometheus jwt或两种身份验证模式public,默认情况下,MinIO以jwt mode 运行。要允许对prometheus度量标准不进行身份验证就可以进行公共访问,请按如下所示设置环境。

export MINIO_PROMETHEUS_AUTH_TYPE="public"
minio server ~/test

经过身份验证的Prometheus配置

MinIO中的Prometheus端点默认需要身份验证。Prometheus支持使用承载令牌方法对Prometheus抓取请求进行身份验证,并使用mc生成的默认Prometheus配置覆盖默认的Prometheus配置。要为别名生成Prometheus配置,请使用mc,如下所示mc admin prometheus generate 。

该命令将生成scrape_configs prometheus.yml 的部分,如下所示:

scrape_configs:
- job_name: minio-job
bearer_token: <secret>
metrics_path: /minio/prometheus/metrics
scheme: http
static_configs:
- targets: ['localhost:9000']

Public Prometheus配置

如果Prometheus端点身份验证类型设置为public。遵循prometheus的配置足以开始从MinIO抓取指标数据。

scrape_configs:
- job_name: minio-job
metrics_path: /minio/prometheus/metrics
scheme: http
static_configs:
- targets: ['localhost:9000']

scrape_configs 更新部分prometheus.yml

要授权每个刮取请求,请将生成的scrape_configs部分复制并粘贴到prometheus.yml中,然后重新启动Prometheus服务。

MinIO公开的指标列表

MinIO服务器在/ minio / prometheus / metrics端点上公开以下指标。 所有这些都可以通过Prometheus仪表板进行访问。 演示服务器的https://play.min.io:9000/minio/prometheus/metrics 中提供了暴露指标的完整列表及其定义。

这些是将在之后生效的新指标集RELEASE.2019-10-16*。下面列出了此更新中的一些关键更改。 -指标绑定到各个节点,并且不在群集范围内。集群中的每个节点都将公开自己的指标。 -添加了涵盖s3和节点间流量统计信息的其他指标。 -记录http统计信息和延迟的度量标准被标记为其各自的API(putobject,getobject等)。 -磁盘使用情况指标已分发并标记到相应的磁盘路径。

指标列表及其定义如下。(注意:这里的实例是一个MinIO节点)

  • 标准go运行时指标的前缀 go_
  • 流程级别指标以开头 process_
  • prometheus 抓取以开头的指标 promhttp_
  • disk_storage_used : 磁盘使用的磁盘空间。
  • disk_storage_available: 磁盘上剩余的可用磁盘空间。
  • disk_storage_total: 磁盘上的总磁盘空间。
  • minio_disks_offline: 当前MinIO实例中的脱机磁盘总数。
  • minio_disks_total: 当前MinIO实例中的磁盘总数。
  • s3_requests_total: 当前MinIO实例中s3请求的总数。
  • s3_errors_total: 当前MinIO实例中s3请求中的错误总数。
  • s3_requests_current: 当前MinIO实例中活动s3请求的总数。
  • internode_rx_bytes_total: 当前MinIO服务器实例接收到的节点间字节总数。
  • internode_tx_bytes_total: 当前MinIO服务器实例发送到其他节点的字节总数。
  • s3_rx_bytes_total: 当前MinIO服务器实例接收的s3字节总数。
  • s3_tx_bytes_total: 当前MinIO服务器实例发送的s3字节总数。
  • minio_version_info: 具有提交ID的当前MinIO版本。
  • s3_ttfb_seconds: 保存请求的延迟信息的直方图。

缓存特定指标

启用了磁盘缓存的MinIO Gateway实例公开了与缓存相关的指标。

  • cache_data_served:cache_data_served:从缓存提供的总字节数。
  • cache_hits_total:cache_hits_total:缓存命中总数。
  • cache_misses_total:cache_misses_total:缓存未命中总数。

MinIO自愈指标 - self_heal_*

MinIO 仅针对擦除代码部署公开与自我修复相关的指标。这些度量标准在网关或单节点单驱动器部署中不可用。请注意,只有在MinIO服务器上发生相关事件时,才会公开这些指标。

  • self_heal_time_since_last_activity:自上一次自我修复相关活动以来经过的时间。
  • self_heal_objects_scanned:在当前运行中由自愈线程扫描的对象数。重新开始自我修复运行时,它将重置。这用扫描的对象类型标记。
  • self_heal_objects_healed: 当前运行中通过自愈线程修复的对象数。重新开始自我修复运行时,它将重置。这用扫描的对象类型标记。
  • self_heal_objects_heal_failed:当前运行中自愈失败的对象数。重新开始自我修复运行时,它将重置。这被标记为磁盘状态及其端点。

MinIO监控指南的更多相关文章

  1. [AlwaysOn Availability Groups]AG排查和监控指南

    AG排查和监控指南 1. 排查场景 如下表包含了常用排查的场景.根据被分为几个场景类型,比如Configuration,client connectivity,failover和performance ...

  2. Centos 6.x 安装Nagios及WEB管理nagiosql实现windows及linux监控指南

    一.Nagios简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报 ...

  3. Sentry 开发者贡献指南 - SDK 开发(性能监控)

    内容整理于官方开发文档 系列 Docker Compose 部署与故障排除详解 K8S + Helm 一键微服务部署 Sentry 开发者贡献指南 - 前端(ReactJS生态) Sentry 开发者 ...

  4. Apache Spark 2.2.0 中文文档 - 集群模式概述 | ApacheCN

    集群模式概述 该文档给出了 Spark 如何在集群上运行.使之更容易来理解所涉及到的组件的简短概述.通过阅读 应用提交指南 来学习关于在集群上启动应用. 组件 Spark 应用在集群上作为独立的进程组 ...

  5. zabbix中文配置指南(转)-服务器监控

    一.Zabbix简介 1.1 Zabbix简介 Zabbix是一个企业级的开源分布式监控解决方案,由一个国外的团队持续维护更新,软件可以自由下载使用,运作团队靠提供收费的技术支持赢利.官方网站:htt ...

  6. Knockout应用开发指南 第二章:监控属性(Observables)

    原文:Knockout应用开发指南 第二章:监控属性(Observables) 关于Knockout的3个重要概念(Observables,DependentObservables,Observabl ...

  7. DBA_实践指南系列7_Oracle Erp R12监控OAM(案例)

    2013-12-07 Created By BaoXinjian

  8. Sentry 开发者贡献指南 - SDK 开发(性能监控:Sentry SDK API 演进)

    内容整理自官方开发文档 本文档的目标是将 Sentry SDK 中性能监控功能的演变置于上下文中. 我们首先总结了如何将性能监控添加到 Sentry 和 SDK, 然后我们讨论 identified ...

  9. 业务驱动的全景监控体系在阿里的应用 | 阿里巴巴DevOps实践指南

    编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...

随机推荐

  1. Python 数据科学手册:读书笔记概论

    为防止遗忘,在空闲时间将读书的笔记开始按照章节进行概括总结(2022.1.1): 第二章:NumPy 入门 第三章:Pandas 数据处理 第四章:Matplotlib 数据可视化 第五章:机器学习 ...

  2. java的Test 如何使用@Autowired注解

    1.配置来至bean.xml @RunWith(SpringJUnit4ClassRunner.class) @ContextConfiguration(locations = "class ...

  3. 分析 java.util.Hashtable 源码

    概述 基于J11,该类已经淘汰,如果使用线程安全的则用 ConcurrentHashMap ,用线程不安全的则使用 HashMap .仅与HashMap进行比较 结构以及依赖关系 HashTable ...

  4. 4-4 Spring Test

    Spring Test Ⅰ.主要解决的问题 使用SpringTest前 手动加载Sping配置 手动从Spring容器中获取对象 使用SpringTest后 只需要通过注解指定Spring配置类 在S ...

  5. 在CDH webUI中部署HDFS HA

    一.点击hdfs按钮进入hdfs配置界面 二.开始部署hdfs ha 三.分配角色 设置存储路径,这个可以自定义,我还在学习阶段我就默认了,之前改过,没起来,默认就好了:

  6. 从零开始Blazor Server(2)--整合数据库

    开篇 上一篇文章我们留了个尾巴,没有把freesql整合进去,这篇文章我们来整合. 目前的思路呢,是做一个简单的四不像的RABC,也有用户.角色. 权限三部分. 但是其中每个用户只有一个角色,即用户和 ...

  7. 快速新建并配置一个eslint+prettier+husky+commitlint+vue3+vite+ts+pnpm的项目

    前置准备 一台电脑 vscode pnpm vscode插件:ESLint v2.2.6及以上 vscode插件:Prettier - Code formatter v9.5.0及以上 vscode插 ...

  8. MySQL源码解析之执行计划

    MySQL源码解析之执行计划 MySQL执行计划介绍 MySQL执行计划代码概览 MySQL执行计划总结 一.MySQL执行计划介绍 在MySQL中,执行计划的实现是基于JOIN和QEP_TAB这两个 ...

  9. 监督学习集成模型——AdaBoost

    一.集成学习与Boosting 集成学习是指将多个弱学习器组合成一个强学习器,这个强学习器能取所有弱学习器之所长,达到相对的最佳性能的一种学习范式. 集成学习主要包括Boosting和Bagging两 ...

  10. MQ系列3:RocketMQ 架构分析

    MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 1 背景 我们前面两篇对主流消息队列的基本构成和技术选型做了详细的分析.从本篇开始,我们会专注当下主流MQ之一的RocketMQ. 从 ...