一、服务发现

Prometheus 中是如何使用服务发现来查找和抓取目标的。我们知道在 Prometheus 配置文件中可以通过一个 static_configs 来配置静态的抓取任务，但是在云环境下，特别是容器环境下，抓取目标地址是经常变动的，所以用静态的方式就不能满足这些场景了，还有特别在很多服务器需要监控时。所以我们需要监控系统能够动态感知这个变化，不可能每次变动都去手动重新配置的，为了应对复杂的动态环境，Prometheus 也提供了与基础设施中的服务发现集成的功能。

Prometheus 已经支持多种内置的服务发现机制：

● 发现云服务商的 VM 虚拟机

● Kubernetes 上的自动发现

● 通用的服务查找，例如 DNS、Consul、Zookeeper 或自定义发现机制

    可以通过 Prometheus 配置文件中的 scrape_config 部分进行配置，Prometheus 会不断更新动态的抓取目标列表，自动停止抓取旧的实例，
开始抓取新的实例，Prometheus 特别适合运行于 Kubernetes 集群下面，可以自动发现监控目标。

    此外大部分服务发现机制还会提供目标的一些元数据，通常都是带有 __ 的前缀， 比如标签、注解、服务名等等，可以在 relabeling 阶段使用这些
元数据来过滤修改目标，这些元信息标签在重新标记阶段后被删除。

二、基于文件的服务发现

除了基于 Consul 的服务发现之外，Prometheus 也允许我们进行自定义的发现集成，可以通过 watch 一组本地文件来获取抓取目标以及标签信息，也就是我们常说的基于文件的服务发现方式

基于文件的服务发现提供了一种更通用的方式来配置静态目标，并作为一个接口插入自定义服务发现机制。

它读取一组包含零个或多个 <static_config> 列表的文件，对所有定义的文件的变更通过磁盘监视被检测到并立即应用，文件可以以 YAML 或 JSON 格式提供。文件必须包含一个静态配置的列表:

当然该文件也可以使用 JSON 格式进行配置：

[

  {

    "targets": [ "<host>", ... ],

    "labels": {

      "<labelname>": "<labelvalue>", ...

    }

  },

  ...

]

如果是 YAML 文件则格式为：

- targets:

  [ - '<host>' ]

  labels:

    [ <labelname>: <labelvalue> ... ]

文件内容也会在指定的刷新间隔时间内定期重新读取。

# Patterns for files from which target groups are extracted.

files:

  [ - <filename_pattern> ... ]

# Refresh interval to re-read the files.

[ refresh_interval: <duration> | default = 5m ]

其中 <filename*pattern> 可以是一个以 .json、.yml 或 .yaml 结尾的路径，最后一个路径段可以包含一个匹配任何字符序列的 *，例如：my/path/tg_*.json。

3.1 创建文件

创建一个用于服务发现的目标文件，在与 prometheus.yml 文件相同目录下面创建一个名为 targets.yml 的文件，内容如下所示：

cd /data/docker-prometheus

mkdir prometheus/targets

cat > prometheus/targets/targets.yml<<"EOF"

- targets: ['localhost:9090']

  labels:

    job: prometheus

- targets: ['cadvisor:8080']

  labels:

    instance: Prometheus服务器

    job: cadvisor

- targets: ['192.168.10.100:8080']

  labels:

    instance: test服务器

    job: cadvisor

- targets: ['node_exporter:9100']

  labels:

    instance: Prometheus服务器

    job: node-exporter

- targets: ['192.168.10.100:9100']

  labels:

    instance: test服务器

    job: node-exporter

- targets: ['192.168.10.100:9113']

  labels:

    instance: test服务器

    job: nginx_exporter

- targets: ['192.168.10.100:9121']

  labels:

    instance: test服务器

    job: redis_exporter

- targets: ['192.168.10.100:9419']

  labels:

    instance: test服务器

    job: rabitmq_exporter

- targets: ['192.168.10.100:9216']

  labels:

    instance: test服务器

    job: mongodb_exporter

- targets: ['192.168.10.100:9104']

  labels:

    instance: test服务器

    job: mysqld_exporter

- targets: ['192.168.10.100:9256']

  labels:

    instance: test服务器

    job: process

EOF

springboot.yaml

cat >prometheus/targets/springboot.yml<<"EOF"

- targets:

  - 192.168.10.100:8081

EOF

blackbox-exporter-http.yml

cat >prometheus/targets/blackbox-exporter-http.yml<<"EOF"

- targets:

  - https://www.baidu.com

  - https://www.jd.com

EOF

blackbox-exporter-tcp.yml

cat >prometheus/targets/blackbox-exporter-tcp.yml<<"EOF"

- targets:

  - 192.168.0.14:22

  - 192.168.10.14:9090

EOF

blackbox-exporter-icmp.yml

cat >prometheus/targets/blackbox-exporter-icmp.yml<<"EOF"

- targets:

  - 192.168.10.14

  - 192.168.10.100

EOF

cat >prometheus/targets/domain.yml<<"EOF"

- targets:

  - qq.com

  - baidu.com

EOF

3.2 配置文件服务发现

用于发现的目标文件创建完成后，要让 Prometheus 能够从上面的 targets.yml 文件中自动读取抓取目标，需要在 prometheus.yml 配置文件中的 scrape_configs 部分添加如下所示的抓取配置：

备份文件

cp -a prometheus/prometheus.yml{,.bak}

ls -l promethues/prometheus.yml.bak

使用新的prometheus.yaml文件

cat >prometheus/prometheus.yml<<"EOF"

# 全局配置

global:

  scrape_interval:     15s # 将搜刮间隔设置为每15秒一次。默认是每1分钟一次。

  evaluation_interval: 15s # 每15秒评估一次规则。默认是每1分钟一次。

# Alertmanager 配置

alerting:

  alertmanagers:

  - static_configs:

    - targets: ['alertmanager:9093']

# 报警(触发器)配置

rule_files:

  - "alert.yml"

  - "rules/*.yml"

# 搜刮配置

scrape_configs:

  - job_name: "file-sd-test"

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - "targets/targets.yml"

#  Spring Boot 2.x 应用数据采集配置

  - job_name: 'file-springboot-demo'

    metrics_path: '/actuator/prometheus'

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - targets/springboot.yml

#http配置

  - job_name: "file-blackbox_http"

    metrics_path: /probe

    params:

      module: [http_2xx]

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - targets/blackbox-exporter-http.yml

    relabel_configs:

      - source_labels: [__address__]

        target_label: __param_target

      - source_labels: [__param_target]

        target_label: instance

      - target_label: __address__

        replacement: 192.168.10.100:9115

#tcp检查配置

  - job_name: "file-blackbox_tcp"

    metrics_path: /probe

    params:

      module: [tcp_connect]

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - targets/blackbox-exporter-tcp.yml

    relabel_configs:

      - source_labels: [__address__]

        target_label: __param_target

      - source_labels: [__param_target]

        target_label: instance

      - target_label: __address__

        replacement: 192.168.10.100:9115

#icmp检查配置 ping

  - job_name: "blackbox_icmp"

    metrics_path: /probe

    params:

      module: [icmp]

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - targets/blackbox-exporter-http.yml

    relabel_configs:

      - source_labels: [__address__]

        target_label: __param_target

      - source_labels: [__param_target]

        target_label: instance

      - target_label: __address__

        replacement: 192.168.10.100:9115

  - job_name: domain

    #scrape_interval: 1h

    scrape_interval: 15s

    metrics_path: /probe

    relabel_configs:

      - source_labels: [__address__]

        target_label: __param_target

      - target_label: __address__

        replacement: 192.168.10.100:9222 # domain_exporter address

    file_sd_configs:

    - refresh_interval: 10s

      files:

      - targets/domain.yml

EOF

重新载入：curl -X POST http://localhost:9090/-/reload

重新 reload 或者重启下 Prometheus 让其重新读取配置文件信息，然后同样前往 Prometheus UI 的 targets 页面下面查看

http://192.168.10.14:9090/targets?search=

然后我们可以尝试改变 targets.yml 的内容，比如为192.168.10.100:8080实例nginx_exporter增加一个 env: test的标签，不用重新加载 Prometheus 配置，Prometheus 将 watch 该文件，并自动接收任何变化。

注意：当在生产环境 Prometheus 服务器中改变 file_sd 目标文件时，确保改变是原子的，以避免重新加载出现错误，最好的方法是在一个单独的位置创建更新的文件，然后将其重命名为目标文件名（使用 mv 命令或 rename() 系统调用）

基于文件的通用服务发现机制，可以让我们动态地改变 Prometheus 的监控目标，而不需要重新启动或重新加载 Prometheus 服务。

17.prometheus服务发现&基于文件的服务发现的更多相关文章

prometheus — 基于文件的服务发现
基于文件的服务发现方式不需要依赖其他平台与第三方服务,用户只需将要新的target信息以yaml或json文件格式添加到target文件中 ,prometheus会定期从指定文件中读取target信息 ...
Prometheus 基于文件的服务发现
Prometheus 基于文件的服务发现官方文档:https://github.com/prometheus/prometheus/tree/master/discovery 服务发现支持: end ...
Prometheus基于文件的服务发现
Prometheus基于文件的服务发现一.基于文件的服务发现 1.prometheus.yml 配置文件的写法 2.file_sd 目录下的文件 3.配置结果二.注意事项三.参考链接一.基于文 ...
prometheus 基于文件的目标发现
prometheus 基于文件的目标发现 1.创建目录 cd /usr/local/prometheus/conf mkdir -pv targets/{nodes,docker} 2.修改prome ...
day112:MoFang:种植园使用websocket代替http&服务端基于flask-socketio提供服务&服务端响应信息&种植园页面显示初始化
目录 1.种植园使用websocket代替http 2.服务端基于socket提供服务 3.服务端响应信息 4.种植园页面展示 1.种植园使用websocket代替http 我们需要完成的种植园,是一 ...
第2-3-7章个人网盘服务接口开发-文件存储服务系统-nginx/fastDFS/minio/阿里云oss/七牛云oss
目录 5.8 导入其他接口代码 5.8.1 接口导入-分页查询附件 5.8.2 接口导入-根据业务类型/业务id查询附件 5.9 导入网盘服务接口 5.9.1 导入FileController 5.9 ...
.NET Core微服务之基于Consul实现服务治理
Tip: 此篇已加入.NET Core微服务基础系列文章索引一.Consul基础介绍 Consul是HashiCorp公司推出的开源工具,用于实现分布式系统的服务发现与配置.与其他分布式服务注册与发 ...
.NET Core微服务之基于Consul实现服务治理（续）
Tip: 此篇已加入.NET Core微服务基础系列文章索引上一篇发布之后,很多人点赞和评论,不胜惶恐,这一篇把上一篇没有弄到的东西补一下,也算是给各位前来询问的朋友的一些回复吧. 一.Consul ...
.NET Core微服务之基于Ocelot实现API网关服务
Tip: 此篇已加入.NET Core微服务基础系列文章索引一.啥是API网关? API 网关一般放到微服务的最前端,并且要让API 网关变成由应用所发起的每个请求的入口.这样就可以明显的简化客户端 ...
『学了就忘』Linux服务管理 — 77、RPM包安装基于xinetd的服务的管理
目录 1.基于xinetd服务的启动管理 (1)telnet服务安装 (2)telnet服务启动 2.基于xientd服务的自启动管理现在Linux系统中基于xinetd的服务越来越少了,但Linu ...

随机推荐

.Net MinimalApis响应返回值
前言文本主要讲 MinimalApis 中的使用自定义IResultModel和系统自带IResult做响应返回值. MinimalApis支持以下类型的返回值: string - 这包括 Task ...
vue,vuex,element实现无限tab页效果
直接撸代码 ?满足你码云地址效果图 tab页由来甲方爸爸的更改需求,无力反抗分析代码懒的写,直接撸就行参考文章点我
Dynamic ReLU：微软推出提点神器，可能是最好的ReLU改进 | ECCV 2020
论文提出了动态ReLU,能够根据输入动态地调整对应的分段激活函数,与ReLU及其变种对比,仅需额外的少量计算即可带来大幅的性能提升,能无缝嵌入到当前的主流模型中来源:晓飞的算法工程笔记公众号 ...
KingbaseES 执行计划常见节点介绍
KingbaseES中explain命令来查看执行计划时最常用的方式.其命令格式如下: explain [option] statement 其中option为可选项,常用的是以下5种情况的组合: a ...
KingbaseES 基于SQL的函数过程
什么是SQL函数? SQL函数包体是一些可执行的SQL语言.同时包含1条以上的查询,但是函数只返回最后一个查询(必须是SELECT)的结果. 除非SQL函数声明为返回void,否则最后一条语句必须是S ...
Scala 类型检查和转换
(1)obj.isInstanceOf[T]:判断 obj 是不是 T 类型. (2)obj.asInstanceOf[T]:将 obj 强转成 T 类型. (3)classOf 获取对象的类名. 1 ...
组合数学——Min-Max容斥
Min-Max 容斥,即 $$\max(S)=\sum_{T\in S,T\neq\emptyset}(-1)^{|T|-1}\min(T)$$ 接下来证明上面那个式子是对的.定义 $S$ 中共有 ...
教你构建一个优秀的SD Prompt
构建一个优秀的Prompt 在使用Stable Diffusion AI时,构建一个有效的提示(Prompt)是至关重要的第一步.这个过程涉及到创造性的尝试和对AI行为的理解.这里我会对如何构建一个好 ...
异步、多线程、Java爬取某网站图片
一.网页图片爬取类 package com.yhyl.utils; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import or ...
npm发包教程
1-npm注册账号访问npm官网注册账号,邮件验证激活账号 npm官网 2-项目npm配置在项目下打开终端,初始化npm npm init -y 此时项目下会生成package.json 配置文件 ...