Java应用系统监控方法简介
1. tsar
阿里巴巴开源的实时系统监控工具。其内部的sunfire有部分指标就是基于该工具每分钟采集一次来获取的。
github
监控项及数据来源一览
| 监控项 | 来源 | 细分项 |
|---|---|---|
| CPU | /proc/stat | user: 表示CPU执行用户进程的时间,通常期望用户空间CPU越高越好. |
| sys: 表示CPU在内核运行时间,系统CPU占用率高,表明系统某部分存在瓶颈.通常值越低越好. | ||
| wait: CPU在等待I/O操作完成所花费的时间.系统部应该花费大量时间来等待I/O操作,否则就说明I/O存在瓶颈. | ||
| hirq: 系统处理硬中断所花费的时间百分比 | ||
| sirq: 系统处理软中断所花费的时间百分比 | ||
| util: CPU总使用的时间百分比 | ||
| nice: 系统调整进程优先级所花费的时间百分比 | ||
| steal: 被强制等待(involuntary wait)虚拟CPU的时间,此时hypervisor在为另一个虚拟处理器服务 | ||
| ncpu: CPU的总个数 | ||
| mem | /proc/meminfo | free: 空闲的物理内存的大小 |
| used: 已经使用的内存大小 | ||
| buff: buff使用的内存大小,buffer is something that has yet to be "written" to disk. | ||
| cach: 操作系统会把经常访问的东西放在cache中加快执行速度,A cache is something that has been "read" from the disk and stored for later use | ||
| total: 系统总的内存大小 | ||
| util: 内存使用率 | ||
| load | /proc/loadavg | load1: 一分钟的系统平均负载 |
| load5: 五分钟的系统平均负载 | ||
| load15:十五分钟的系统平均负载 | ||
| runq: 在采样时刻,运行队列的任务的数目,与/proc/stat的procs_running表示相同意思 | ||
| plit: 在采样时刻,系统中活跃的任务的个数(不包括运行已经结束的任务) | ||
| traffic | /proc/net/dev | bytin: 入口流量byte/s |
| bytout: 出口流量byte/s | ||
| pktin: 入口pkt/s | ||
| pktout: 出口pkt/s | ||
| tcp | /proc/net/snmp | active:主动打开的tcp连接数目 |
| pasive:被动打开的tcp连接数目 | ||
| iseg: 收到的tcp报文数目 | ||
| outseg:发出的tcp报文数目 | ||
| EstRes:Number of resets that have occurred at ESTABLISHED | ||
| AtmpFa:Number of failed connection attempts | ||
| CurrEs:当前状态为ESTABLISHED的tcp连接数 | ||
| retran:系统的重传率 | ||
| udp | /proc/net/snmp | idgm: 收到的udp报文数目 |
| odgm: 发送的udp报文数目 | ||
| noport:udp协议层接收到目的地址或目的端口不存在的数据包 | ||
| idmerr:udp层接收到的无效数据包的个数 | ||
| io | /proc/diskstats | 指标较多,略 |
| partition | /etc/mtab + statfs | bfree: 分区空闲的字节 |
| bused: 分区使用中的字节 | ||
| btotl: 分区总的大小 | ||
| util: 分区使用率 | ||
| ifree: 可用文件结点数 | ||
| itotl: 文件结点总数 | ||
| iutil: 文件结点使用率 | ||
| pcsw | cswch: 进程切换次数 | |
| proc: 新建的进程数 | ||
| tcpx | /proc/net/netstat /proc/net/snmp | 多个指标,略 |
| percpu ncpu | 同cpu模块 | |
| pernic | 同traffic模块 | |
| 应用proc | /proc/pid/stat:获取进程的cpu信息 /proc/pid/status:获取进程的mem信息 /proc/pid/io:获取进程的读写IO信息 | user: 某个进程用户态cpu消耗 |
| sys: 某个进程系统态cpu消耗 | ||
| total:某个进程总的cpu消耗 | ||
| mem: 某个进程的内存消耗百分比 | ||
| RSS: 某个进程的虚拟内存消耗,这是驻留在物理内存的一部分.它没有交换到硬盘.它包括代码,数据和栈 | ||
| read: 进程io读字节 | ||
| write:进程的io写字节 | ||
| nginx | nginx采集模块 |
2. JAVA应用监控 —— metric
注册监听点及监控周期,进行被监控指标的输出。
引用及使用方式:系统监控-Metric
3. 企业级集群监控 —— open-falcon
Java应用系统监控方法简介的更多相关文章
- 浅析IT系统监控方法和应用
浅析IT系统监控方法和应用 http://blog.csdn.net/zhangman117/article/details/35549363
- java枚举类Enum方法简介(valueof,value,ordinal)
Enum作为Sun全新引进的一个关键字,看起来很象是特殊的class, 它也可以有自己的变量,可以定义自己的方法,可以实现一个或者多个接口. 当我们在声明一个enum类型时,我们应该注意到en ...
- java sigar 系统监控
<dependency> <groupId>org</groupId> <artifactId>sigar</artifactId> < ...
- Metaspace 之二--Java 8的元空间(metaspace)、metaspace监控方法
很多开发者都在其系统中见过“java.lang.OutOfMemoryError: PermGen space”这一问题.这往往是由类加载器相关的内存泄漏以及新类加载器的创建导致的,通常出现于代码热部 ...
- Java系统监控(淘汰sigar)
Sigar是Hyperic-hq产品的基础包,是Hyperic HQ主要的数据收集组件.它用来从许多平台收集系统和处理信息. 这些平台包括:Linux, Windows, Solaris, AIX, ...
- Java如何实现系统监控、系统信息收集(转
Java如何实现系统监控.系统信息收集.sigar开源API的学习 系统监控(1) Jar资源下载:http://download.csdn.net/detail/yixiaoping/4903853 ...
- 获取当前应用的系统路径工具类和java的System.getProperty()方法介绍
java的System.getProperty()方法可以获取的值,如下: 对于Java程序,无论是未打包的还是打包的JAR或WAR文件,有时候都需要获取它运行所在目录信息,如何做到这一点呢? /** ...
- Linux系统监控命令及如何定位到Java线程
>>PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID ...
- [论文笔记] 一种Java遗留系统服务化切分和封装方法 (计算机学报, 2009)
李翔,怀进鹏,曾晋,高鹏. 一种Java遗留系统服务化切分和封装方法. 计算机学报, 32(9), 2009, p1084-1815 (gs:5) 1. 本文研究从Java遗留系统中切分并封装出Web ...
- Linux系统监控命令及定位Java线程
1.PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID.GID:~ ...
随机推荐
- 《深入理解计算机系统》(CSAPP)读书笔记 —— 第五章 优化程序性能
写程序最主要的目标就是使它在所有可能的情况下都正确工作.一个运行得很快但是给出错误结果的程序没有任何用处.程序员必须写出清晰简洁的代码,这样做不仅是为了自己能够看懂代码,也是为了在检査代码和今后需要修 ...
- @Import 源码解析
转发请注明出处: @Import通过快速导入的方式实现把实例加入spring的IOC容器中:一般@EnableXXX注解是通过@Import实现具体的功能(@EnableXXX注解上加个@Import ...
- Nacos源码 (7) Nacos与Spring
SpringCloud工程可以使用Nacos作为注册中心和配置中心,配置和使用非常简单,本文将简单介绍使用方式,并分析其实现方式. SpringCloud工程集成Nacos SpringCloud工程 ...
- 【MicroPython】生成micropython版本头文件 - py\makeversionhdr.py
用法 $ python makeversionhdr.py mpversion.h 实现 带git仓 get_version_info_from_git 使用git指令: git describe ...
- SqlSugar DbContext
title: SqlSugar DbContext date: 2023-02-16 20:01:41 tags: SqlSugar categories: ORM description: 总结整理 ...
- [转帖]GB18030 编码
https://www.qqxiuzi.cn/zh/hanzi-gb18030-bianma.php GB18030编码采用单字节.双字节.四字节分段编码方案,具体码位见下文.GB18030向下兼容G ...
- 神通数据库的varchar和nvarchar的验证
神通数据库的varchar和nvarchar的验证 登录神通数据库 isql 注意 神通数据库的默认密码是 szoscar55 Welcome to isql 2.0.56 interactive t ...
- ZHS16GBK字符集下面Oracle数据库varchar与nvarchar的验证
ZHS16GBK字符集下面Oracle数据库varchar与nvarchar的验证 背景 周末分析了 SQLServer mysql等数据库 想着继续分析一下oracle数据库 这边oracle使用的 ...
- [转帖]SQL Server 2008~2022版本序列号/密钥/激活码 汇总
https://www.cnblogs.com/cqpanda/p/16148822.html SQL Server 2022# Enterprise: J4V48-P8MM4-9N3J9-HD97X ...
- [转帖]防火墙、DCD与TCP Keep alive
https://www.laoxiong.net/tag/network 在以前我写的一篇文章<Oracle与防火墙>中提到,网络防火墙会切断长时间空闲的TCP连接,这个空闲时间具体多长可 ...