去年写过一篇基于jmx监控的文章,这次在Openshift上实现,发现确实不少变化。主要重点问题在

1. prometheus jmx exporter的改进,不再需要运行一个独立的进程,不需要把数据输入到influxdb,

而是直接提供了prometheus数据。链接在

https://github.com/prometheus/jmx_exporter

2. OpenShift上采用prometheus Operator架构,内置了集群的监控指标,在此基础上如何集成客户化的监控数据。

接下来我们就看看具体的实现过程。

1. 针对应用镜像的修改

下载agent的jmx_prometheus_javaagent-0.12.0.jar包,具体链接在

https://github.com/prometheus/jmx_exporter

以tomcat为例,构建一个镜像

[root@master jmx]# ls
catalina.sh config.yaml Dockerfile jmx_prometheus_javaagent-0.12..jar

Dockerfile

[root@master jmx]# cat Dockerfile
FROM registry.example.com/tomcat:-slim COPY *.* /usr/local/tomcat/bin/ CMD ["catalina.sh", "run"]

catalina.sh 是从镜像中拷贝出来的,修改了如下地方

CLASSPATH=/usr/local/tomcat/bin

JAVA_OPTS="-javaagent:/usr/local/tomcat/bin/jmx_prometheus_javaagent-0.12.0.jar=8180:/usr/local/tomcat/bin/config.yaml $JAVA_OPTS $JSSE_OPTS"

因为缺省的8080和tomcat启动端口冲突,所以修改为8180

config.yaml, 最简单的配置,什么信息都获取

---
lowercaseOutputLabelNames: true
lowercaseOutputName: true

然后构建部署

docker build -t registry.example.com/tomcatjmx:-slim .

docker push registry.example.com/tomcatjmx:-slim

oc import-image tomcatjmx:-slim --from=registry.example.com/tomcatjmx:-slim --confirm --insecure=true

完成后在myproject的image下看到有个tomcatjmx:8-slim

在service下开放8180端口,修改yaml文件,加入8180端口

    - name: -tcp
port:
protocol: TCP
targetPort:

然后应用镜像工作基本完成。

2.prometheus 添加target

OpenShift的 prometheus采用Operator进行部署,基于servicemonitor的模式对服务进行监控。

在OpenShift环境中内置了servicemonitor

[root@master jmx]# oc -n openshift-monitoring get servicemonitor
NAME AGE
alertmanager 175d
cluster-monitoring-operator 175d
etcd 6d
kube-apiserver 175d
kube-controllers 175d
kube-state-metrics 175d
kubelet 175d
node-exporter 175d
prometheus 175d
prometheus-operator 175d

service monitor通过namespace确定工作范围,同时基于Label对服务(Service)进行监控

我们如果需要对自己的服务进行监控,就需要建立一个客户化的Service monitor

[root@master ~]# cat myservicemonitor.yaml
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: tomcatmonitor
labels:
k8s-app: tomcatmonitor
namespace: openshift-monitoring
spec:
namespaceSelector:
any: true
selector:
matchLabels:
app: tomcatjmx
endpoints:
- interval: 30s
path: /metrics
port: -tcp

比较核心的地方是selector, 决定对哪个服务进行监控,另外就是endpoint,针对哪个port获取指标。

创建后可以通过下面命令看到

[root@master ~]# oc -n openshift-monitoring get servicemonitor
NAME AGE
alertmanager 175d
cluster-monitoring-operator 175d
etcd 6d
kube-apiserver 175d
kube-controllers 175d
kube-state-metrics 175d
kubelet 175d
node-exporter 175d
prometheus 175d
prometheus-operator 175d
tomcatmonitor 1h

但这时候在prometheus的target上是看不到我们tomcatmonitor的,因为缺少了授权工作,添加RBAC的授权

oc adm policy add-cluster-role-to-user view system:serviceaccount:openshift-monitoring:prometheus-k8s

oc adm policy add-role-to-user view system:serviceaccount:openshift-monitoring:prometheus-k8s -n myproject

完成后,在prometheus target界面上看到tomcatjmx服务已经启动

转去指标界面看到一系列指标

3. 集成grafana

这部分工作比较耗时,主要是要找到合适的图标导入,

我在

https://grafana.com/grafana/dashboards?search=jmx

上找了好几个,最后发现 https://grafana.com/grafana/dashboards/8878

比较合适。导入后展现结果,好处是可以直接选择project,service,然后选择相应的pod

heap和non-heap的指标

GC time

改进:

可以让servicemonitor监听所有打了jmx: jvm标签的服务。这样只要在服务上加上标签,就可以被监控。

至此工作完成. Enjoy!

OpenShift下的JVM监控的更多相关文章

  1. Java系列笔记(4) - JVM监控与调优

    目录 参数设置收集器搭配启动内存分配监控工具和方法调优方法调优实例     光说不练假把式,学习Java GC机制的目的是为了实用,也就是为了在JVM出现问题时分析原因并解决之.通过学习,我觉得JVM ...

  2. jvm 监控

    jvm监控可视化的有 jconsole .jmc .jvisualvm 其中jvisualvm开启一些监控会导致他自己关闭. 并且jdk下有很多工具可以进行jvm监控, jmap -histo:liv ...

  3. JVM监控与调优

    目录 参数设置收集器搭配启动内存分配监控工具和方法调优方法调优实例     转:http://www.cnblogs.com/zhguang/p/java-jvm-gc.html光说不练假把式,学习J ...

  4. JVM监控命令详解(转)

    JVM监控命令基本就是 jps.jstack.jmap.jhat.jstat 几个命令的使用就可以了 JDK本身提供了很多方便的JVM性能调优监控工具,除了集成式的VisualVM和jConsole外 ...

  5. [java] JVM监控与调优

    原文出处:http://www.cnblogs.com/zhguang/p/java-jvm-gc.html   光说不练假把式,学习Java GC机制的目的是为了实用,也就是为了在JVM出现问题时分 ...

  6. JVM监控和调优常用命令工具总结

    JVM监控和调优 在Java应用和服务出现莫名的卡顿.CPU飙升等问题时总是要分析一下对应进程的JVM状态以定位问题和解决问题并作出相应的优化,在这过程中Java自带的一些状态监控命令和图形化工具就非 ...

  7. Linux下Java性能监控

    Linux下Java性能监控 一.JVM堆内存使用监控 获取thread dump的3种方法: 1)使用$JAVA_HOME/bin/jcosole中的MBean,到MBean>com.sun. ...

  8. Kubernetes下的应用监控解决方案

    所谓应用监控,更多的是基于java jvm的监控,因为公司运行的中间件大部分都是基于tomcat,Springboot,SpringCloud,当然也必须支持WebLogic.在Kubernetes现 ...

  9. 无意间做了个 web 版的 JVM 监控端(前后端分离 React+Spring Boot)

    之前写了JConsole.VisualVM 依赖的 JMX 技术,然后放出了一个用纯 JMX 实现的 web 版本的 JConsole 的截图,今天源码来了. 本来就是为了更多的了解 JMX,第一步就 ...

随机推荐

  1. 使用WebApi和Asp.Net Core Identity 认证 Blazor WebAssembly(Blazor客户端应用)

    原文:https://chrissainty.com/securing-your-blazor-apps-authentication-with-clientside-blazor-using-web ...

  2. js 加密混淆工具

    访问路径:https://www.sojson.com/javascriptobfuscator.html

  3. [git] your branch is ahead of ... 解决办法

    出现该问题表示在次之前已经有X个commite了,执行命令git reset --hard HEAD~X解决其中X表示有多少次提交,此命令的意思是回退到x个commit之前.git reset --h ...

  4. 【AI测试】也许这有你想知道的人工智能 (AI) 测试--第二篇

    概述此为人工智能 (AI) 测试第二篇 第一篇主要介绍了 人工智能测试.测试什么.测试数据等.第二篇主要介绍测试用例和测试报告.之后的文章可能具体介绍如何开展各项测试,以及具体项目举例如何测试.测试用 ...

  5. 使用Lambda解决_inbound_nodes错误

    Keras出现了下面的错误: AttributeError: 'NoneType' object has no attribute '_inbound_nodes' 原因是使用了Keras backe ...

  6. Rust中的Cargo工作空间实践

    这是为了开发大型程序,分治crate用的. 目录结构如下: 一,根cargo.toml内容 [workspace] members = [ "adder", "add-o ...

  7. MLflow安装配置初入门

    学习这个时,要和Kubeflow作比较, 看看它们俩在解决和规范机器学习流程方面的思路异同. mlflow三大内涵: Tracking, Projects, Models. 一,基础镜像 harbor ...

  8. 登录-退出,在T分钟实现BC次用户登录退出,单次登录-退出%90用户时间t,需要的并发用户(线程)

    聚合报告%90响应时间:%90用户响应时小于该值 2种理解方式: 一. 1s可完成的用户1/t: T分钟完成的用户T *(1/t); BC次用户需要的线程数Thread= BC/(T*(1/t)) = ...

  9. C#基础表达式语句详解(下)

    书接上文: 4.选择语句:if语句和switch语句 4.1If语句:statement:两种格式:A与B A:If(boolean-expression)embedded-statement(嵌入式 ...

  10. python中调用httpclient接口的实例代码

    #coding=utf-8 import httplib,urllib #get调用 httpClient=None try: params=urllib.urlencode({'account':' ...