监控系统中非常重要的一环,就是告警,系统得在故障发生的第一时间将事件发送出来,通知干系人,prometheus提供了alertmanager来实现这个功能. 第一步:prometheus.yml配置文件,配置alertmanager地址 第二步:编写触发器,也就是在什么情况下产生告警. Prometheus.yml填写触发器配置文件路径 alert_rule.yml内容 groups: - name: node rules: - alert: node_cpu>80% expr: (1-rate…