一、环境部署

yum search java | grep jdk
yum install -y java-11-openjdk-devel

二、监控java应用(tomcat/jar)

JMX exporter 负责收集 Java 虚拟机信息---没举例,等以后再做测试

进入到tomcat安装目录,vim

PROMETHEUS_JMX_EXPORTER_OPTS="-javaagent:../prometheus-exporter/jmx_prometheus_javaagent-0.18.0.jar=12345:../prometheus-exporter/tomcat.yml"
JAVA_OPTS="-Xmx4096m -XX:MetaspaceSize=256m -XX:MaxMetaspaceSize=2048m -Xss1024K $PROMETHEUS_JMX_EXPORTER_OPTS"

三、监控java应用(springboot)

分4个步骤

1、引入maven依赖

2、application.propertiesl配置

3、prometheus配置采集springboot2.x应用提供的监控样本数据

4、grafana将prometheus作为数据源进行可视化展示

3.1 springboot项目(二选一)

引入maven依赖

修改pom.xml添加如下代码,引入Spring Boot Actuator的相关依赖。

<!-- spring-boot-actuator依赖 -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<!-- prometheus依赖 -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-registry-prometheus</artifactId>
</dependency>

application.propertiesl配置

在application.properties中添加相关配置暴露监测数据端口,如果是application.yaml格式,需要转成yaml

出于安全考虑,默认情况下除了/health和/info之外的所有actuator都是关闭的

server.port=8081
spring.application.name=springboot-demo management.endpoints.web.exposure.include=prometheus,health
#management.endpoints.web.exposure.include=*
#management.endpoints.web.exposure.exclude=env,beans
management.metrics.tags.application=${spring.application.name}

3.2 使用现成的springboot项目(二选一)

docker安装

提前把springboot项目添加了依赖,并开启了prometheus,封装成镜像,服务器上安装的CAdvisor已经把8080端口占用了。所以映射为8081端口
docker run -d --restart=always -p 8081:8080 --name springboot-demo linge365/springboot-demo

检查:

http://192.168.10.100:8081/actuator/prometheus

3.3 Prometheus配置

prometheus配置采集springboot2.x的应用target提供的数据

cd /data/docker-prometheus 

#在scrape_configs(搜刮配置):下面增加如下配置:

cat >> prometheus/prometheus.yml << "EOF"
# Spring Boot 2.x 应用数据采集配置
- job_name: 'springboot-demo'
metrics_path: '/actuator/prometheus'
scrape_interval: 5s
static_configs:
- targets: ['192.168.10.100:8081']
EOF

重新加载:curl -X POST http://localhost:9090/-/reload

查看:

http://192.168.10.14:9090/graph

http://192.168.10.14:9090/targets?search=

3.4 监控指标

process_files_max_files # 最大文件处理数量

tomcat_sessions_active_current_sessions # Tomcat 当前活跃 session 数量

tomcat_sessions_alive_max_seconds # Tomcat session 最大存活时间

jvm_buffer_total_capacity_bytes   # 预估的池中缓冲区的总容量

jvm_threads_daemon_threads # 当前守护进程的线程数量

tomcat_global_request_max_seconds{name="http-nio-8080",} # 全局最长一次请求的时间

tomcat_sessions_active_max_sessions # 最大活跃 session 数量

system_cpu_usage # CPU 利用率
jvm_buffer_memory_used_bytes # 预估 Java 虚拟机用于此缓冲池的内存 jvm_classes_loaded_classes # 当前在 Java 虚拟机中加载的类的数量 jvm_memory_committed_bytes # 为 Java 虚拟机提交的内存量(以字节为单位) jvm_threads_live_threads # 当前线程数,包括守护进程和非守护进程的线程 tomcat_threads_config_max_threads # 配置的 Tomcat 的最大线程数 tomcat_global_received_bytes_total # Tomcat 接收到的数据量 tomcat_global_sent_bytes_total # Tomcat 发送的数据量 tomcat_threads_current_threads # Tomcat 当前的线程数 tomcat_sessions_created_sessions_total # Tomcat 创建的 session 数 system_load_average_1m # 在一段时间内,排队到可用处理器的可运行实体数量和可用处理器上运行的可运行实体数量的总和的平均值 tomcat_sessions_expired_sessions_total # 过期的 session 数量 jvm_buffer_count_buffers # 预估的池中的缓冲区数量 jvm_memory_used_bytes# JVM 内存使用量 process_uptime_seconds # Java 虚拟机的正常运行时间 jvm_gc_memory_allocated_bytes_total # 增加一个 GC 到下一个 GC 之后年轻代内存池的大小增加 jvm_gc_pause_seconds_count # GC暂停耗时数量和总时间
jvm_gc_pause_seconds_sum
jvm_gc_pause_seconds_max tomcat_sessions_rejected_sessions_total # 被拒绝的 session 总数 jvm_gc_live_data_size_bytes# Full GC 后的老年代内存池的大小 tomcat_threads_busy_threads # Tomcat 繁忙线程数 jvm_threads_peak_threads # 自 Java 虚拟机启动或峰值重置以来的最高活动线程数 jvm_threads_states_threads # 当前具有 NEW 状态的线程数 jvm_gc_max_data_size_bytes # jvm_gc内存池的最大大小 http_server_requests_seconds_count #某个接口的请求数量和请求总时间
http_server_requests_seconds_sum
http_server_requests_seconds_max jvm_gc_memory_promoted_bytes_total # GC之前到GC之后的老年代内存池大小的正增加计数 # 日志按级别计数
logback_events_total{application="prometheus-demo",level="info",} 7.0
logback_events_total{application="prometheus-demo",level="trace",} 0.0
logback_events_total{application="prometheus-demo",level="warn",} 0.0
logback_events_total{application="prometheus-demo",level="debug",} 0.0
logback_events_total{application="prometheus-demo",level="error",} 0.0 process_start_time_seconds # 启动时间 process_files_open_files # 打开文件描述符的数量 tomcat_global_error_total # 异常数量 jvm_memory_max_bytes # 可用于内存管理的最大内存量(以字节为单位) process_cpu_usage # 最近的 CPU 利用率 jvm_classes_unloaded_classes_total # 自 Java 虚拟机开始执行以来卸载的类总数 system_cpu_count # CPU 核数 tomcat_global_request_seconds_count # 全局请求总数和总耗时
tomcat_global_request_seconds_sum

3.5 触发器

cat >> prometheus/rules/springboot.yml <<"EOF"
groups:
- name: SprinBoot
rules:
- alert: SprinBooErrorEvents
expr: increase(logback_events_total{level="error"}[2m]) > 0
for: 2m
labels:
severity: warning
annotations:
summary: "Springboot错误事件 容器: $labels.instance"
description: "在过去2分钟有新的{{ $value }}个错误事件"
EOF

重新加载配置:

curl -X POST http://localhost:9090/-/reload

检查:

http://192.168.10.14:9090/alerts?search=

http://192.168.10.14:9090/rules

3.6 grafana dashboard 数据展示

grafana将prometheus作为数据源进行可视化展示
https://grafana.com/grafana/dashboards/12856-jvm-micrometer/ # 1 SLS JVM监控大盘
https://grafana.com/grafana/dashboards/4701-jvm-micrometer/ # JVM(Micrometer)
https://grafana.com/grafana/dashboards/10280 # Sprint Boot 2.1 Statistics
https://grafana.com/grafana/dashboards/12900-springboot-apm-dashboard/ # 监控数据库连接池dashboard
hikari连接池:https://grafana.com/grafana/dashboards/6083 # SpringBoot HikariCP /JDBC
druid连接池:https://grafana.com/grafana/dashboards/11157 # Druid Connection Pool Dashboard

9.prometheus监控--监控springboot2.x(Java)的更多相关文章

  1. 基于Docker+Prometheus+Grafana监控SpringBoot健康信息

    在微服务体系当中,监控是必不可少的.当系统环境超过指定的阀值以后,需要提醒指定的运维人员或开发人员进行有效的防范,从而降低系统宕机的风险.在CNCF云计算平台中,Prometheus+Grafana是 ...

  2. Prometheus自定义监控内容

    Prometheus自定义监控内容 一.io.micrometer的使用 1.1 Counter 1.2 Gauge 1.3 Timer 1.4 Summary 二.扩展 相关内容原文地址: 博客园: ...

  3. Prometheus+Grafana监控

    什么是Prometheus? Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB).Prometheus使用Go语言开发,是Google BorgMon监控系统 ...

  4. 实战 Prometheus 搭建监控系统

    实战 Prometheus 搭建监控系统 Prometheus 是一款基于时序数据库的开源监控告警系统,说起 Prometheus 则不得不提 SoundCloud,这是一个在线音乐分享的平台,类似于 ...

  5. Prometheus+Grafana监控SpringBoot

    Prometheus+Grafana监控SpringBoot 一.Prometheus监控SpringBoot 1.1 pom.xml添加依赖 1.2 修改application.yml配置文件 1. ...

  6. Prometheus 系统监控方案 一

    最近一直在折腾时序类型的数据库,经过一段时间项目应用,觉得十分不错.而Prometheus又是刚刚推出不久的开源方案,中文资料较少,所以打算写一系列应用的实践过程分享一下. Prometheus 是什 ...

  7. VisualVM监控远程主机上的JAVA应用程序

    使用VisualVM监控远程主机上JAVA应用程序时,需要开启远程主机上的远程监控访问,或者在远程JAVA应用程序启动时,开启远程监控选项,两种方法,选择其中一种就可以开启远程监控功能,配置完成后就可 ...

  8. Grafana+Prometheus系统监控之webhook

    概述 Webhook是一个API概念,并且变得越来越流行.我们能用事件描述的事物越多,webhook的作用范围也就越大.Webhook作为一个轻量的事件处理应用,正变得越来越有用. 准确的说webho ...

  9. cAdvisor+Prometheus+Grafana监控docker

    cAdvisor+Prometheus+Grafana监控docker 一.cAdvisor(需要监控的主机都要安装) 官方地址:https://github.com/google/cadvisor ...

  10. 使用Prometheus+Grafana监控MySQL实践

    一.介绍Prometheus Prometheus(普罗米修斯)是一套开源的监控&报警&时间序列数据库的组合,起始是由SoundCloud公司开发的.随着发展,越来越多公司和组织接受采 ...

随机推荐

  1. TP6框架--EasyAdmin学习笔记:定义路由

    这是我写的学习EasyAdmin的第二章,这一章我给大家分享下如何定义一条路由 正常的tp6定义路由方法如下: /route/admins/app.php 文件内容 //路由变量自定义 Route:: ...

  2. cadence板图设计基本操作

    基于cadence的四位全加器设计及仿真. 1.实验原理 板图,也就是芯片的原理图.通过学习板图的绘制,可以有效地提高对芯片的工作原理的认识.在版图设计中,需要掌握许多的规则,能够按照特定的规范优化, ...

  3. .NET分布式Orleans - 6 - 事件溯源

    基本概念 事件溯源(Event Sourcing)是一种设计模式,它记录并存储了应用程序状态变化的所有事件. 其核心思想是将系统中的每次状态变化都视为一个事件,并将这些事件以时间顺序的方式持久化存储. ...

  4. Lab2:System Call

    trace 该系统调用程序,可以跟踪其他的系统调用命令,该系统调用的形参为一个整数掩码.其具体实参为1 << sys_call所得到的整数值,sys_call是一个系统调用指令在内核中定义 ...

  5. 循环队列(LoopQueue)

    循环队列相比普通的队列,元素出队时无需移动大量元素. 代码 ArrayQueue.h 点它 代码清单 #ifndef C___LOOPQUEUE_H #define C___LOOPQUEUE_H # ...

  6. #树链剖分,线段树#洛谷 2486 [SDOI2011]染色

    题目 分析 就是把维护颜色段和树结合起来, 注意拼接的时候要减去中间相同的部分 代码 #include <cstdio> #include <cctype> #include ...

  7. 基于文件语义实现S3接口语义的注意事项

    本文标题中提到的文件语义,指的是POSIX规范. S3指的是AWS提供的对象存储服务以及相关接口.为方便描述,下文中以对象语义替代S3接口语义. 文件语义和对象语义存在比较多的差异. 对象语义不支持文 ...

  8. 使用site-maven-plugin在github上搭建公有仓库

    目录 简介 前期准备 在maven中配置GitHub权限 配置deploy-plugin 配置site-maven-plugin 怎么使用这个共享的项目 总结 简介 Maven是我们在开发java程序 ...

  9. Techwalk攻略 | 来北京与OpenHarmony技术大会一起技术漫游!

     去北京Citywalk已经不是新鲜事? 不如来第二届OpenHarmony技术大会一起Techwalk! 大会即将开幕请速速收藏以下打卡攻略↓ 点击链接,观看线上直播

  10. 新版本NOI Linux发布,支持VSCode,Code::Blocks开发C++!!!,内附下载地址。

    注意VSCODE 虽然有C艹插件,但是在第一次编译的时候必须要有网络,否则用不了 我推荐还是用CODE::BLOCKS 作者10月8日补充 有些省份已经开始强制在NOIP的比赛里使用NOI Linux ...