prometheus 监控系统
一. 安装docker环境
#01 安装docker# step 1: 安装必要的一些系统工具sudo yum install -y yum-utils device-mapper-persistent-data lvm2# Step 2: 添加软件源信息sudo yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo# Step 3sudo sed -i 's+download.docker.com+mirrors.aliyun.com/docker-ce+' /etc/yum.repos.d/docker-ce.repo# Step 4: 更新并安装Docker-CEsudo yum makecache fastsudo yum -y install docker-ce# Step 4: 开启Docker服务sudo service docker start#02 设置镜像加速sudo mkdir -p /etc/dockersudo tee /etc/docker/daemon.json <<-'EOF'{}EOFsudo systemctl daemon-reloadsudo systemctl restart docker#03 安装 docker-composesudo curl -L "https://github.com/docker/compose/releases/download/1.25.5/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-composesudo chmod +x /usr/local/bin/docker-compose |
二. 安装prometheus
2.1 编辑配置文件
#01 编辑配置文件 邮件相关1) alertmanager.yaml[root@iZ2ze9nv7e19wvoseb2sl1Z prometheus]# cat alertmanager.yamlglobal: smtp_smarthost: 'z15119911990@163.com:25' #163服务器 smtp_from: '522308001@qq.com' #发邮件的邮箱 smtp_auth_username: 'z15119911990' #发邮件的邮箱用户名,也就是你的邮箱 smtp_auth_password: 'RVDDRXWLPQHVYNOB'#发邮件的邮箱密码 smtp_require_tls: false #不进行tls验证route: group_by: ['alertname'] group_wait: 10s group_interval: 10s repeat_interval: 10m receiver: live-monitoringreceivers:- name: 'live-monitoring' email_configs: - to: 'z15119911990@163.com'2) node_down.yml 自定义的告警规则文件[root@iZ2ze9nv7e19wvoseb2sl1Z prometheus]# cat node_down.ymlgroups:- name: node_down rules: - alert: InstanceDown expr: up == 0 for: 1m labels: user: test annotations: summary: "Instance {{ $labels.instance }} down" description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 1 minutes."3)主配置文件[root@iZ2ze9nv7e19wvoseb2sl1Z prometheus]# grep -Ev '^#|^$' prometheus.ymlglobal: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute. # scrape_timeout is set to the global default (10s).alerting: alertmanagers: - static_configs: - targets: ['172.17.24.204:9093'] # - alertmanager:9093rule_files: - "node_down.yml" # - "first_rules.yml" # - "second_rules.yml"scrape_configs: # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config. - job_name: 'prometheus' static_configs: - targets: ['172.17.24.204:9090'] - job_name: 'cadvisor' static_configs: - targets: ['172.17.24.204:8080'] - job_name: 'node' scrape_interval: 8s static_configs: - targets: ['172.17.24.204:9100','172.17.24.203:9100'] #抓取被监控主机IP |
2.2 编辑docker-compose
#01 书写docker-compose[root@iZ2ze9nv7e19wvoseb2sl1Z prometheus]# cat docker-compose.yamlversion: '2'networks: mynet: driver: bridgeservices: prometheus: image: prom/prometheus container_name: prometheus hostname: prometheus restart: always volumes: - ./prometheus.yml:/etc/prometheus/prometheus.yml - ./node_down.yml:/etc/prometheus/node_down.yml ports: - "9090:9090" networks: - mynet alertmanager: image: prom/alertmanager container_name: alertmanager hostname: alertmanager restart: always volumes: - ./alertmanager.yaml:/etc/alertmanager/alertmanager.yaml ports: - "9093:9093" networks: - mynet grafana: image: grafana/grafana container_name: grafana hostname: grafana restart: always ports: - "3000:3000" networks: - mynet node-exporter: image: prom/node-exporter #image: quay.io/prometheus/node-exporter container_name: node-exporter hostname: node-exporter restart: always ports: - "9100:9100" networks: - mynet cadvisor: image: google/cadvisor:latest container_name: cadvisor hostname: cadvisor restart: always volumes: - /:/rootfs:ro - /var/run:/var/run:rw - /sys:/sys:ro - /var/lib/docker/:/var/lib/docker:ro ports: - "8080:8080" networks: - mynet#02 启动 docker-compose up -d#03 web验证http://172.17.24.204:9090/ |

三. grafana 展示
#01 登入地址172.17.24.204:3000user: adminpasswd: admin#02 使用node 模版 |

四 添加监控节点
- 选择对应的 exporter
#01 安装exporterdocker pull prom/node-exporterdocker run -d -p 9100:9100 --restart=always prom/node-exporter#02 访问验证http://localhost:9100/#03 修改服务端 prometheus配置文件 - job_name: 'node' scrape_interval: 8s static_configs: - targets: ['172.17.24.204:9100','172.17.24.203:9100'] #抓取被监控主机IP |
五. 监控 java进程
#01 下载wget https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.17.0/jmx_prometheus_javaagent-0.17.0.jar#02 书写配置文件[root@iZ2ze9nv7e19wvoseb2skzZ prometheus]# cat simple-config.ymllowercaseOutputLabelNames: truelowercaseOutputName: truewhitelistObjectNames: ["java.lang:type=OperatingSystem"]blacklistObjectNames: []rules: - pattern: 'java.lang<type=OperatingSystem><>(committed_virtual_memory|free_physical_memory|free_swap_space|total_physical_memory|total_swap_space)_size:' name: os_$1_bytes type: GAUGE attrNameSnakeCase: true - pattern: 'java.lang<type=OperatingSystem><>((?!process_cpu_time)w+):' name: os_$1 type: GAUGE attrNameSnakeCase: true#03 启动服务java -javaagent:./jmx_prometheus_javaagent-0.17.0.jar=9400:simple-config.yaml -jar <你的jar>nohup java -javaagent:./jmx_prometheus_javaagent-0.17.0.jar=9400:simple-config.yml -jar /data/project/pigx-upms-biz/pigx-upms-biz.jar -java.tmp.dir=/data/upload_tmp  书写启动脚本/opt/prometheus/jmx_prometheus_javaagent-0.17.0.jar/opt/prometheus/simple-config.yml-javaagent:/opt/prometheus/jmx_prometheus_javaagent-0.17.0.jar=9400:/opt/prometheus/simple-config.yml[root@iZ2ze9nv7e19wvoseb2skzZ prometheus]# cat /root/sh/pigx-upms-biz.sh#!/bin/bashsource /etc/profilePORT=4000kill -9 $(lsof -i:$PORT | grep LISTEN | awk '{print $2}')sleep 5secho "$name kill"name_tmp=${0%\.*}name=${name_tmp##*/}LOG_PATH=${name%%.jar}Promtheus="-javaagent:/opt/prometheus/jmx_prometheus_javaagent-0.17.0.jar=9400:/opt/prometheus/simple-config.yml "echo $name#nohup java -jar -Dfile.encoding=UTF-8 -Xms128m -Xmx1g -Dlog.path=/pigx/$LOG_PATH /data/project/$name/$name.jar -java.tmp.dir=/data/upload_tmp >> /data/project/$name/$name.log 2>&1 &nohup java ${Promtheus} -jar -Dfile.encoding=UTF-8 -Xms128m -Xmx1g -Dlog.path=/pigx/$LOG_PATH /data/project/$name/$name.jar -java.tmp.dir=/data/upload_tmp >> /data/project/$name/$name.log 2>&1 & |

六. 自动化监控服务
Java 项目集成的前提条件
需要是 springboot 的项目
需要启用 actuator
需要集成 micrometer
需要激活配置
- 参考链接:https://blog.csdn.net/chuanbo0429/article/details/100751862
#依赖项目 <dependency> <groupId>io.micrometer</groupId> <artifactId>micrometer-registry-prometheus</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> <version>2.2.0.RELEASE</version> </dependency> |
- 启动类
@SpringBootApplicationpublic class Springboot2PrometheusApplication { public static void main(String[] args) { SpringApplication.run(Springboot2PrometheusApplication.class, args); } @Bean MeterRegistryCustomizer<MeterRegistry> configurer( @Value("${spring.application.name}") String applicationName) { return (registry) -> registry.config().commonTags("application", applicationName); }} |
- 配置
management.endpoints.web.exposure.include=*
management.metrics.tags.application=${spring.application.name}
micrometer-registry-prometheus 指定版本可能会导致不兼容
management.endpoints.web.base-path=/admin
management.server.port=8090
- grafana id = 4701
prometheus 监控系统的更多相关文章
- Prometheus监控系统之入门篇(一)续
在上篇Prometheus监控系统之入门篇(一)中我们讲解了Prometheus的基本架构和工作流程, 并从0到1搭建了Prometheus服务,pushgateway以及告警系统. 本篇我们主要介绍 ...
- 容器编排系统K8s之Prometheus监控系统+Grafana部署
前文我们聊到了k8s的apiservice资源结合自定义apiserver扩展原生apiserver功能的相关话题,回顾请参考:https://www.cnblogs.com/qiuhom-1874/ ...
- prometheus监控系统
关于Prometheus Prometheus是一套开源的监控系统,它将所有信息都存储为时间序列数据:因此实现一种Profiling监控方式,实时分析系统运行的状态.执行时间.调用次数等,以找到系统的 ...
- Prometheus监控系统之入门篇(一)
1. 简介 Prometheus: (简称Prom)是由SoundCloud开发的开源监控报警系统.是大名鼎鼎的CNCF云原生基金会下的第二大开源项目.具有如下特点: 使用Go语言开发 内置时序数据库 ...
- Grafana+Zabbix+Prometheus 监控系统
环境说明 软件 版本 操作系统 IP地址 Grafana 5.4.3-1 Centos7.5 192.168.18.231 Prometheus 2.6.1 Centos7.5 192.168.18. ...
- 使用Docker部署监控系统,Prometheus,Grafana,监控服务器信息及Mysql
使用Docker部署监控系统,Prometheus,Grafana,监控服务器信息及Mysql 一.docker部署prometheus监控系统 1.1 配置安装环境 1.1.1 安装promethe ...
- 使用docker方式构建prometheus监控的学习
一.背景:近期学习部署prometheus监控系统,经研究发现prometheus提供docker运行模式.根据我的经验,能够使用docker模式构建系统一定多快好省. 二.环境: 1.centos7 ...
- 图文详解Prometheus监控+Grafana+Alertmanager告警安装使用
一:前言 一个服务上线了后,你想知道这个服务是否可用,需要监控.假如线上出故障了,你要先于顾客感知错误,你需要监控.还有对数据库,服务器的监控,等等各层面的监控. 近年来,微服务架构的流行,服务数越来 ...
- Prometheus监控神器-Alertmanager篇(1)
本章节主要涵盖了Alertmanager的工作机制与配置文件的比较详细的知识内容,由浅入深的给大家讲解. 警报一直是整个监控系统中的重要组成部分,Prometheus监控系统中,采集与警报是分离的.警 ...
- Prometheus监控神器-Rules篇
本章主要对如何使用Prometheus与Alertmanager组件集成配置,以及对警报规则 Rules 的俩种类型及其模板内容进行讲解. 与Alertmanager集成 Prometheus把产生的 ...
随机推荐
- 从零开始配置vim(20)——模糊查询
在讲解vim的基础功能的时候,介绍过了vim的各种查询技巧,在同一个文件中进行搜索的话,那些技巧很有用.在多个文件中我们介绍了使用vim自带的 :grep命令进行搜索,使用quickfix 列表进行跳 ...
- Spring框架源码分析
目录 Spring核心思想 Spring源码编译 自定义实现Spring框架IOC与DI Spring源码Ioc核心模块分析 BeanDefinition整体介绍 FactoryBean接口的使用 B ...
- JVM底层原理
目录 1.类加载器与ClassFileFormate 2.JVM内存模型 3.对象在JVM中的创建与内存分配 4.对象引用与垃圾回收算法 5.JVM垃圾回收 6.G1垃圾回收器 7.ZGC垃圾回收器
- 推荐系统[三]:粗排算法常用模型汇总(集合选择和精准预估),技术发展历史(向量內积,Wide&Deep等模型)以及前沿技术
1.前言:召回排序流程策略算法简介 推荐可分为以下四个流程,分别是召回.粗排.精排以及重排: 召回是源头,在某种意义上决定着整个推荐的天花板: 粗排是初筛,一般不会上复杂模型: 精排是整个推荐环节的重 ...
- element实现大图预览和图片动态加载
element的el-image组件支持大图预览模式,但需要和小图模式配合使用,项目中刚好有需求需要直接使用大图预览并且需要支持图片的动态加载,研究了一下el-image组件的源码发现el-image ...
- 从CPU100%高危故障到稳定在10%:一个月的优化之旅,成功上线!
引言 经过三个月的开发,项目通过了所有测试并上线,然而,我们发现项目的首页几乎无法打开,后台一直发生超时错误,导致CPU过度负荷.在这次项目开发过程中,我制定了一份详细的技术优化方案.考虑到客户无法提 ...
- 2023年多校联训NOIP层测试4+洛谷 8 月月赛 I & RiOI Round 2
2023年多校联训NOIP层测试4 爆零了 T1 幸运数字 \(0pts\) 首先考虑一个结论: \(4\) 的倍数一定满足最后两位能被 \(4\) 整除. 从 \(1\) 进行输入,方便处理.若枚举 ...
- BZOJ3156 防御准备 题解
原题 令 \(S_{i} =\sum\limits_{j=1}^{i}j\) , \(f_{i}\) 为处理到第 \(i\) 个位置放置守卫塔的最小花费. 观察题意,容易得到在\((1 \le j \ ...
- JS Leetcode 263. 丑数 题解分析,来认识有趣的丑数吧
壹 ❀ 引 本题来自LeetCode263. 丑数,难度简单,题目描述如下: 给你一个整数 n ,请你判断 n 是否为 丑数 .如果是,返回 true :否则,返回 false . 丑数 就是只包含质 ...
- 多线程系列(二) -Thread类使用详解
一.简介 在之前的文章中,我们简单的介绍了线程诞生的意义和基本概念,采用多线程的编程方式,能充分利用 CPU 资源,显著的提升程序的执行效率. 其中java.lang.Thread是 Java 实现多 ...