Java应用系统监控方法简介
1. tsar
阿里巴巴开源的实时系统监控工具。其内部的sunfire有部分指标就是基于该工具每分钟采集一次来获取的。
github
监控项及数据来源一览
| 监控项 | 来源 | 细分项 |
|---|---|---|
| CPU | /proc/stat | user: 表示CPU执行用户进程的时间,通常期望用户空间CPU越高越好. |
| sys: 表示CPU在内核运行时间,系统CPU占用率高,表明系统某部分存在瓶颈.通常值越低越好. | ||
| wait: CPU在等待I/O操作完成所花费的时间.系统部应该花费大量时间来等待I/O操作,否则就说明I/O存在瓶颈. | ||
| hirq: 系统处理硬中断所花费的时间百分比 | ||
| sirq: 系统处理软中断所花费的时间百分比 | ||
| util: CPU总使用的时间百分比 | ||
| nice: 系统调整进程优先级所花费的时间百分比 | ||
| steal: 被强制等待(involuntary wait)虚拟CPU的时间,此时hypervisor在为另一个虚拟处理器服务 | ||
| ncpu: CPU的总个数 | ||
| mem | /proc/meminfo | free: 空闲的物理内存的大小 |
| used: 已经使用的内存大小 | ||
| buff: buff使用的内存大小,buffer is something that has yet to be "written" to disk. | ||
| cach: 操作系统会把经常访问的东西放在cache中加快执行速度,A cache is something that has been "read" from the disk and stored for later use | ||
| total: 系统总的内存大小 | ||
| util: 内存使用率 | ||
| load | /proc/loadavg | load1: 一分钟的系统平均负载 |
| load5: 五分钟的系统平均负载 | ||
| load15:十五分钟的系统平均负载 | ||
| runq: 在采样时刻,运行队列的任务的数目,与/proc/stat的procs_running表示相同意思 | ||
| plit: 在采样时刻,系统中活跃的任务的个数(不包括运行已经结束的任务) | ||
| traffic | /proc/net/dev | bytin: 入口流量byte/s |
| bytout: 出口流量byte/s | ||
| pktin: 入口pkt/s | ||
| pktout: 出口pkt/s | ||
| tcp | /proc/net/snmp | active:主动打开的tcp连接数目 |
| pasive:被动打开的tcp连接数目 | ||
| iseg: 收到的tcp报文数目 | ||
| outseg:发出的tcp报文数目 | ||
| EstRes:Number of resets that have occurred at ESTABLISHED | ||
| AtmpFa:Number of failed connection attempts | ||
| CurrEs:当前状态为ESTABLISHED的tcp连接数 | ||
| retran:系统的重传率 | ||
| udp | /proc/net/snmp | idgm: 收到的udp报文数目 |
| odgm: 发送的udp报文数目 | ||
| noport:udp协议层接收到目的地址或目的端口不存在的数据包 | ||
| idmerr:udp层接收到的无效数据包的个数 | ||
| io | /proc/diskstats | 指标较多,略 |
| partition | /etc/mtab + statfs | bfree: 分区空闲的字节 |
| bused: 分区使用中的字节 | ||
| btotl: 分区总的大小 | ||
| util: 分区使用率 | ||
| ifree: 可用文件结点数 | ||
| itotl: 文件结点总数 | ||
| iutil: 文件结点使用率 | ||
| pcsw | cswch: 进程切换次数 | |
| proc: 新建的进程数 | ||
| tcpx | /proc/net/netstat /proc/net/snmp | 多个指标,略 |
| percpu ncpu | 同cpu模块 | |
| pernic | 同traffic模块 | |
| 应用proc | /proc/pid/stat:获取进程的cpu信息 /proc/pid/status:获取进程的mem信息 /proc/pid/io:获取进程的读写IO信息 | user: 某个进程用户态cpu消耗 |
| sys: 某个进程系统态cpu消耗 | ||
| total:某个进程总的cpu消耗 | ||
| mem: 某个进程的内存消耗百分比 | ||
| RSS: 某个进程的虚拟内存消耗,这是驻留在物理内存的一部分.它没有交换到硬盘.它包括代码,数据和栈 | ||
| read: 进程io读字节 | ||
| write:进程的io写字节 | ||
| nginx | nginx采集模块 |
2. JAVA应用监控 —— metric
注册监听点及监控周期,进行被监控指标的输出。
引用及使用方式:系统监控-Metric
3. 企业级集群监控 —— open-falcon
Java应用系统监控方法简介的更多相关文章
- 浅析IT系统监控方法和应用
浅析IT系统监控方法和应用 http://blog.csdn.net/zhangman117/article/details/35549363
- java枚举类Enum方法简介(valueof,value,ordinal)
Enum作为Sun全新引进的一个关键字,看起来很象是特殊的class, 它也可以有自己的变量,可以定义自己的方法,可以实现一个或者多个接口. 当我们在声明一个enum类型时,我们应该注意到en ...
- java sigar 系统监控
<dependency> <groupId>org</groupId> <artifactId>sigar</artifactId> < ...
- Metaspace 之二--Java 8的元空间(metaspace)、metaspace监控方法
很多开发者都在其系统中见过“java.lang.OutOfMemoryError: PermGen space”这一问题.这往往是由类加载器相关的内存泄漏以及新类加载器的创建导致的,通常出现于代码热部 ...
- Java系统监控(淘汰sigar)
Sigar是Hyperic-hq产品的基础包,是Hyperic HQ主要的数据收集组件.它用来从许多平台收集系统和处理信息. 这些平台包括:Linux, Windows, Solaris, AIX, ...
- Java如何实现系统监控、系统信息收集(转
Java如何实现系统监控.系统信息收集.sigar开源API的学习 系统监控(1) Jar资源下载:http://download.csdn.net/detail/yixiaoping/4903853 ...
- 获取当前应用的系统路径工具类和java的System.getProperty()方法介绍
java的System.getProperty()方法可以获取的值,如下: 对于Java程序,无论是未打包的还是打包的JAR或WAR文件,有时候都需要获取它运行所在目录信息,如何做到这一点呢? /** ...
- Linux系统监控命令及如何定位到Java线程
>>PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID ...
- [论文笔记] 一种Java遗留系统服务化切分和封装方法 (计算机学报, 2009)
李翔,怀进鹏,曾晋,高鹏. 一种Java遗留系统服务化切分和封装方法. 计算机学报, 32(9), 2009, p1084-1815 (gs:5) 1. 本文研究从Java遗留系统中切分并封装出Web ...
- Linux系统监控命令及定位Java线程
1.PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID.GID:~ ...
随机推荐
- 又一创新!阿里云 Serverless 调度论文被云计算顶会 ACM SoCC 收录
近日,阿里云函数计算产品团队撰写的关于 Serverless 调度的创新性论文,被云计算领域 ACM SoCC 国际会议长文录用. 去年阿里云函数计算团队首个提出在 FaaS 场景下的去中心化快速镜像 ...
- S3C2440移植linux3.4.2内核之内核框架介绍及简单修改
目录 uboot启动内核分析 简单配置内核 编译内核 设置机器ID 修改晶振 uboot启动内核分析 进入cmd_bootm.c,找到对应的bootm命令对应的do_bootm(): int do ...
- package.json文件中版本号
"5.0.3"表示安装指定的5.0.3版本,"-5.0.3"表示安装5.0.X中最新的版本,"^5.0.3"表示安装5.X.X中最新的版本.
- CommonJS 和 ES6 Module 究竟有什么区别?
https://juejin.im/post/5e5f10176fb9a07cd443c1e2
- Tomcat 与 JVM 中classpath的理解和设置总结
本文为博主原创,转载请注明出处: 1.介绍 classpath是java运行时环境搜索类和其他资源文件(比如jar\zip等资源)的路径.类路径告诉JDK工具和应用程序在哪里可以找到第三方和用户定义的 ...
- spring-transaction源码分析(2)EnableTransactionManagement注解
概述(Java doc) 该注解开启spring的注解驱动事务管理功能,通常标注在@Configuration类上面用于开启命令式事务管理或响应式事务管理. @Configuration @Enabl ...
- Pgsql之查询一段时间内的所有年月yyyy-mm
前几天干活儿的时候,报表中有这么个需求,需要用pgsql查询两个日期间的所有年月,下面贴代码: 1 with recursive t(n) as ( 2 select date('2020-01-01 ...
- 【VSCode】秒下vscode
有时从vscode官网下载速度奇慢甚至失败,介绍一种方法可以秒下 进入官网选择要下载的版本 像我的电脑,下载网址根本打不开 修改下载网址,替换下载地址中红框字符串:vscode.cdn.azure.c ...
- [转帖]如何通过dba_hist_active_sess_history分析数据库历史性能问题
https://www.cnblogs.com/DataArt/p/10018932.html 在数据库运行的过程中,我们有时会碰到数据库hung住的问题,在这个时候很多人会选择尽快让它恢复正常而不是 ...
- Oracle存储过程的基本学习
Oracle存储过程的基本学习 摘要 这个简要学习应该会分为上下两部分 第一部分是存储过程的学习. 第二部分是python的学习. 核心目标是查询Oracle数据库中的主键数据. 如果有主键upper ...