获取软件包

最新的软件包获取地址

https://prometheus.io/download/

Prometheus

1、下载Prometheus

$ wget https://github.com/prometheus/prometheus/releases/download/v2.6.0/prometheus-2.6.0.linux-amd64.tar.gz

2、解压软件包

$ tar xf prometheus-2.6.0.linux-amd64.tar.gz

3、配置Prometheus启动程序

把解压出来的文件移动到/usr/local/目录下,并重命名为prometheu

$ mv prometheus-2.6.0.linux-amd64 /usr/local/prometheus

生成启动脚本

$ vim /usr/lib/systemd/system/prometheus.service
[Unit]
Description=Prometheus: the monitoring system
Documentation=http://prometheus.io/docs/ [Service]
ExecStart=/usr/local/prometheus/prometheus \
--config.file=/usr/local/prometheus/prometheus.yml \
--storage.tsdb.path=/var/lib/prometheus \
--web.console.templates=/usr/local/prometheus/consoles \
--web.console.libraries=/usr/local/prometheus/console_libraries \
--web.listen-address=0.0.0.0:9090 --web.external-url=
Restart=always
StartLimitInterval=0
RestartSec=10 [Install]
WantedBy=multi-user.target

创建监控数据存储目录

$ mkdir /var/lib/prometheus

4、启动Prometheus

$ systemctl daemon-reload
$ systemctl enable prometheus
$ systemctl start prometheus

5、查看端口监听状态

Prometheus监听的端口为9090,启动成功后可以通过netstat命令进行查看端口的监听状态

$ netstat -antpu | grep 9090
tcp 0 0 127.0.0.1:33270 127.0.0.1:9090 ESTABLISHED 6426/prometheus
tcp6 0 0 :::9090 :::* LISTEN 6426/prometheus
tcp6 0 0 ::1:9090 ::1:51821 ESTABLISHED 6426/prometheus
tcp6 0 0 ::1:51821 ::1:9090 ESTABLISHED 6426/prometheus
tcp6 0 0 127.0.0.1:9090 127.0.0.1:33270 ESTABLISHED 6426/prometheus

6、通过浏览器进行访问

Prometheus启动成功后,可以通过浏览器访问查看状态和配置信息

Ceph_export

Ceph_export 需要使用Go进行编译,也可以下载已经编译好的Ceph_exporter直接使用

链接:https://pan.baidu.com/s/1AEF_pdDvSJ5gMPapaBuBrA

提取码:jkuh

1、安装软件Go环境

$ yum -y install golang

2、查看Go环境变量

$ go env
GOARCH="amd64"
GOBIN=""
GOCACHE="/root/.cache/go-build"
GOEXE=""
GOFLAGS=""
GOHOSTARCH="amd64"
GOHOSTOS="linux"
GOOS="linux"
GOPATH="/root/go"
GOPROXY=""
GORACE=""
GOROOT="/usr/lib/golang"
GOTMPDIR=""
GOTOOLDIR="/usr/lib/golang/pkg/tool/linux_amd64"
GCCGO="gccgo"
CC="gcc"
CXX="g++"
CGO_ENABLED="1"
GOMOD=""
CGO_CFLAGS="-g -O2"
CGO_CPPFLAGS=""
CGO_CXXFLAGS="-g -O2"
CGO_FFLAGS="-g -O2"
CGO_LDFLAGS="-g -O2"
PKG_CONFIG="pkg-config"
GOGCCFLAGS="-fPIC -m64 -pthread -fmessage-length=0 -fdebug-prefix-map=/tmp/go-build359765015=/tmp/go-build -gno-record-gcc-switches"

3、设置Go环境变量

$ vim /etc/profile.d/go.sh
export GOROOT=/usr/lib/golang
export GOBIN=$GOROOT/bin
export GOPATH=/root/go
export PATH=$PATH:$GOROOT/bin:$GOPATH/bin $ source /etc/profile.d/go.sh

4、下载并编译Ceph_exporter

$ mkdir go/src/github.com/digitalocean/
$ cd go/src/github.com/digitalocean/
$ git clone https://github.com/digitalocean/ceph_exporter
$ cd ceph_exporter
$ go build

5、创建Ceph_exporter启动程序

$ mkdir ~/go/bin/
$ cp ~/go/src/github.com/digitalocean/ceph_exporter/ceph_exporter ~/go/bin/
$ vim /usr/lib/systemd/system/ceph_exporter.service
[Unit]
Description=Prometheus's ceph metrics exporter [Service]
User=root
Group=root
ExecStart=/root/go/bin/ceph_exporter [Install]
WantedBy=multi-user.target
Alias=ceph_exporter.service

6、启动Ceph_exporter

$ systemctl daemon-reload
$ systemctl enable ceph_exporter
$ systemctl start ceph_exporter

7、查看端口监听状态

Ceph_exporter使用的是9128端口,可以通过netstat进行查看端口的监听状态

$ netstat -antpu | grep 9128
tcp6 0 0 :::9128 :::* LISTEN 6839/ceph_exporter

8、修改Prometheus配置

把Ceph_exporter的接口添加到Prometheus的配置中

$ vim /usr/local/prometheus/prometheus.yml
scrape_configs:
- job_name: 'ceph'
honor_labels: true
static_configs:
- targets: ['192.168.1.10:9128']
labels:
instance: Ceph测试集群

9、重启Prometheus进程

$ systemctl restart prometheus

10、浏览器访问验证

Grafana

1、下载软件包

不同系统的最新软件包可以在Grafana的官网获取下载地址https://grafana.com/grafana/download

$ wget https://dl.grafana.com/oss/release/grafana-5.4.3-1.x86_64.rpm

2、安装Grafana

$ yum -y install grafana-5.4.3-1.x86_64.rpm

3、启动Grafana

$ systemctl enable grafana-server
$ systemctl start grafana-server

4、查看端口监听状态

Grafana监听端口为3000,可以使用netstat查看监听状态

$ netstat -antpu | grep 3000
tcp6 0 0 :::3000 :::* LISTEN 7147/grafana-server

5、浏览器访问登录

访问地址为http://$IP:3000,初始用户名和密码均为admin,首次登录后会提示设置新的密码

6、配置Dashboard

点击Add data source添加数据源

选择Prometheus

URL地址为Prometheus的访问地址http://$IP:9090

导入Dashboard,模板的编号为917,如果无法连接互联网,也可以在Grafana的官网下载模板后手动导入https://grafana.com/dashboards/917

查看监控状态

AlertManager

1、安装Alertmanager

$ wget https://github.com/prometheus/alertmanager/releases/download/v0.16.0/alertmanager-0.16.0.linux-amd64.tar.gz
$ tar xf alertmanager-0.16.0-alpha.0.linux-amd64.tar.gz
$ cd alertmanager-0.16.0-alpha.0.linux-amd64
$ cp alertmanager amtool /usr/bin/
$ cp alertmanager.yml /usr/local/prometheus/

2、生成启动程序

$ vim /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=Prometheus: the alerting system
Documentation=http://prometheus.io/docs/
After=prometheus.service [Service]
ExecStart=/usr/bin/alertmanager --config.file=/usr/local/prometheus/alertmanager.yml
Restart=always
StartLimitInterval=0
RestartSec=10 [Install]
WantedBy=multi-user.target

3、启动Alertmanager

$ systemctl enable alertmanager
$ systemctl start alertmanager

4、查看端口监听状态

Alertmanager的监听端口为9093,可以使用netstat查看端口监听状态

$ netstat -antpu | grep 9093
tcp6 0 0 :::9093 :::* LISTEN 7381/alertmanager

5、配置Prometheus,添加Alertmanager端点

$ vim /usr/local/prometheus/prometheus.yml
alerting:
alertmanagers:
- static_configs:
- targets: ["192.168.1.10:9093"]

6、重启Prometheus

$ systemctl restart prometheus

配置钉钉告警

1、配置webhook

$ mkdir -p /usr/lib/golang/src/github.com/timonwong/
$ cd /usr/lib/golang/src/github.com/timonwong/
$ git clone https://github.com/timonwong/prometheus-webhook-dingtalk.git
$ cd prometheus-webhook-dingtalk
$ make
$ nohup ./prometheus-webhook-dingtalk --ding.profile="webhook=https://oapi.dingtalk.com/robot/send?access_token=8fe12c1a58b0769d7fcbf6ebf3bcd2cfcba825f2c45b4b39055890fd705df543" &> /var/log/dingding.log &

2、添加webhook告警

$ vim /usr/local/prometheus/alertmanager.yml
global:
resolve_timeout: 5m route:
group_by: ['alertname']
group_wait: 10s
group_interval: 10s
repeat_interval: 1h
receiver: 'web.hook' receivers:
- name: 'web.hook'
webhook_configs:
- url: 'http://192.168.1.10:8060/dingtalk/webhook/send' inhibit_rules:
- source_match:
severity: 'critical'
target_match:
severity: 'warning'
equal: ['alertname', 'dev', 'instance']

3、添加告警规则文件

$ vim /usr/local/prometheus/prometheus.yml
rule_files:
- /usr/local/prometheus/ceph.yml

4、配置告警规则

$ vim /usr/local/prometheus/ceph.yml
groups:
- name: ceph-rule
rules:
- alert: Ceph OSD Down
expr: ceph_osd_down > 0
for: 2m
labels:
product: Ceph测试集群
annotations:
Warn: "{{$labels.instance}}: 有{{ $value }}个OSD挂掉了"
Description: "{{$labels.instance}}:{{ $labels.osd }}当前状态为{{ $labels.status }}" - alert: 集群空间使用率
expr: ceph_cluster_used_bytes / ceph_cluster_capacity_bytes * 100 > 80
for: 2m
labels:
product: Ceph测试集群
annotations:
Warn: "{{$labels.instance}}:集群空间不足"
Description: "{{$labels.instance}}:当前空间使用率为{{ $value }}"

5、重启进程使配置生效

$ systemctl restart alertmanager
$ systemctl restart prometheus.service

6、钉钉验证

停掉一个OSD后,钉钉收到如下告警


重新启动后收到恢复通知

Grafana+Prometheus实现Ceph监控和钉钉告警-转载(云栖社区)的更多相关文章

  1. Grafana+Prometheus通过node_exporter监控Linux服务器信息

    Grafana+Prometheus通过node_exporter监控Linux服务器信息 一.Grafana+Prometheus通过node_exporter监控Linux服务器信息 1.1nod ...

  2. 基于grafana+prometheus构建Flink监控

    先上一个架构图 Flink App : 通过report 将数据发出去 Pushgateway :  Prometheus 生态中一个重要工具 Prometheus :  一套开源的系统监控报警框架 ...

  3. Docker系列——Grafana+Prometheus+Node-exporter服务器监控平台(一)

    在最近的博文中,都是介绍监控平台的搭建,其实并不难,主要是需要自己动手操作,实践一番就会了. 有天在想,云上的服务器,是不是也可以搭建一个监控平台,所以就捣鼓了一下,不过遗憾的是,使用阿里云开源的插件 ...

  4. Grafana+Prometheus打造springboot监控平台

    1. 环境 springboot 1.5.10.RELEASE Grafana 5.4.2 Prometheus 2.6.0 jdk 1.8 2.通过micrometer与springboot应用和p ...

  5. Docker系列——Grafana+Prometheus+Node-exporter钉钉推送(四)

    近期搭建的服务器监控平台,来进行一个总结.主要分为监控平台的搭建.告警中心的配置以及消息的推送.推送的话,支持多种终端.具体详细可查看之前的博文,在这里罗列下,方便查看. Docker系列--Graf ...

  6. Istio on ACK集成生态(2): 扩展AlertManager集成钉钉助力可观测性监控能力

    阿里云容器服务Kubernetes(简称ACK)支持一键部署Istio,可以参考文档在ACK上部署使用Isito.Istio on ACK提供了丰富的监控能力,为网格中的服务收集遥测数据,其中Mixe ...

  7. docker-compose 快速部署Prometheus之服务端并监控ceph cluster 使用钉钉webhook 报警

    现在环境是这样: ceph 4台: 192.168.100.21  ceph-node1 192.168.100.22  ceph-node2 192.168.100.23  ceph-node3 1 ...

  8. 远见而明察近观若明火|Centos7.6环境基于Prometheus和Grafana结合钉钉机器人打造全时监控(预警)Docker容器服务系统

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_181 我们知道,奉行长期主义的网络公司,势必应在软件开发流程管理体系上具备规范意识,即代码提交有CR(CodeReview),功能 ...

  9. Prometheus+Grafana+钉钉部署一个单机的MySQL监控告警系统

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. GreatSQL是MySQL的国产分支版本,使用上与MySQL一致. 目录 一.Prometheus 二.exporter ...

随机推荐

  1. conda进行python环境隔离

    1.环境隔离的问题 在使用python时,常常遇到的问题: pip安装库A,依赖库B-2.1版本 pip安装库C,以来库B-3.1版本,安装会提示库B的版本冲突错误. 这种情况下就需要做环境隔离 co ...

  2. DNS与ARP协议

    DNS(domain name system) DNS的作用:将域名(如baidu.com)转换为IP地址 DNS的本质是:分层的DNS服务器实现的分布式数据库: 根DNS服务器 - com DNS服 ...

  3. [Go] 数据类型,变量与变量作用域,常量

    // var.gopackage main import ( "fmt" ) func main() { // 声明变量的一般形式是使用 var 关键字,可以一次声明多个变量 // ...

  4. vue获取不到后端返回的响应头

    Response.ContentType = EPPlusHelpler.ExcelContentType; Response.Headers.Add("FileName", fi ...

  5. 简单使用Moq框架

    Moq框架简单使用   系列目录 Moq库简介及安装 Moq简介 Moq是.net平台下的一个非常流行的模拟库,只要有一个接口它就可以动态生成一个对象,底层使用的是Castle的动态代理功能. 它的流 ...

  6. shell 编写脚本批量Ping IP

    服务器总是一下子买了很多的段的ip.通过绑定后,也不知道这些ip是否绑定成功,所以就写了一个shell脚本,把ip输好,批量ping一下,看是不是都能ping通. 脚本如下: 此外.还有一个ip文件, ...

  7. c++中共享内存原理及实现

    共享内存 (也叫内存映射文件) 主要是通过映射机制实现的 , Windows 下进程的地址空间在逻辑上是相互隔离的 , 但在物理上却是重叠的 ; 所谓的重叠是指同一块内存区域可能被多个进程同时使用 , ...

  8. Git 删除所有历史提交记录方法

    Git 删除所有历史提交记录方法 切换分支 git checkout --orphan latest_branch 添加所有文件 git add -A 提交更改 git commit -am &quo ...

  9. java中对对象进行判空的操作--简洁编码

    java中对对象进行判空的操作 首先来看一下工具StringUtils的判断方法: 一种是org.apache.commons.lang3包下的: 另一种是org.springframework.ut ...

  10. php开发工程师都需要掌握什么技能呢?

    PHP原生标准库精通,三种大型框架中熟练掌握一门的开发(Symfony2.Yii.ZF2),小型框架中(Codeigniter 等)通读其一源码. MySQL语句精通,实践构造 1000 万级的数据库 ...