Java应用系统监控方法简介
1. tsar
阿里巴巴开源的实时系统监控工具。其内部的sunfire有部分指标就是基于该工具每分钟采集一次来获取的。
github
监控项及数据来源一览
| 监控项 | 来源 | 细分项 |
|---|---|---|
| CPU | /proc/stat | user: 表示CPU执行用户进程的时间,通常期望用户空间CPU越高越好. |
| sys: 表示CPU在内核运行时间,系统CPU占用率高,表明系统某部分存在瓶颈.通常值越低越好. | ||
| wait: CPU在等待I/O操作完成所花费的时间.系统部应该花费大量时间来等待I/O操作,否则就说明I/O存在瓶颈. | ||
| hirq: 系统处理硬中断所花费的时间百分比 | ||
| sirq: 系统处理软中断所花费的时间百分比 | ||
| util: CPU总使用的时间百分比 | ||
| nice: 系统调整进程优先级所花费的时间百分比 | ||
| steal: 被强制等待(involuntary wait)虚拟CPU的时间,此时hypervisor在为另一个虚拟处理器服务 | ||
| ncpu: CPU的总个数 | ||
| mem | /proc/meminfo | free: 空闲的物理内存的大小 |
| used: 已经使用的内存大小 | ||
| buff: buff使用的内存大小,buffer is something that has yet to be "written" to disk. | ||
| cach: 操作系统会把经常访问的东西放在cache中加快执行速度,A cache is something that has been "read" from the disk and stored for later use | ||
| total: 系统总的内存大小 | ||
| util: 内存使用率 | ||
| load | /proc/loadavg | load1: 一分钟的系统平均负载 |
| load5: 五分钟的系统平均负载 | ||
| load15:十五分钟的系统平均负载 | ||
| runq: 在采样时刻,运行队列的任务的数目,与/proc/stat的procs_running表示相同意思 | ||
| plit: 在采样时刻,系统中活跃的任务的个数(不包括运行已经结束的任务) | ||
| traffic | /proc/net/dev | bytin: 入口流量byte/s |
| bytout: 出口流量byte/s | ||
| pktin: 入口pkt/s | ||
| pktout: 出口pkt/s | ||
| tcp | /proc/net/snmp | active:主动打开的tcp连接数目 |
| pasive:被动打开的tcp连接数目 | ||
| iseg: 收到的tcp报文数目 | ||
| outseg:发出的tcp报文数目 | ||
| EstRes:Number of resets that have occurred at ESTABLISHED | ||
| AtmpFa:Number of failed connection attempts | ||
| CurrEs:当前状态为ESTABLISHED的tcp连接数 | ||
| retran:系统的重传率 | ||
| udp | /proc/net/snmp | idgm: 收到的udp报文数目 |
| odgm: 发送的udp报文数目 | ||
| noport:udp协议层接收到目的地址或目的端口不存在的数据包 | ||
| idmerr:udp层接收到的无效数据包的个数 | ||
| io | /proc/diskstats | 指标较多,略 |
| partition | /etc/mtab + statfs | bfree: 分区空闲的字节 |
| bused: 分区使用中的字节 | ||
| btotl: 分区总的大小 | ||
| util: 分区使用率 | ||
| ifree: 可用文件结点数 | ||
| itotl: 文件结点总数 | ||
| iutil: 文件结点使用率 | ||
| pcsw | cswch: 进程切换次数 | |
| proc: 新建的进程数 | ||
| tcpx | /proc/net/netstat /proc/net/snmp | 多个指标,略 |
| percpu ncpu | 同cpu模块 | |
| pernic | 同traffic模块 | |
| 应用proc | /proc/pid/stat:获取进程的cpu信息 /proc/pid/status:获取进程的mem信息 /proc/pid/io:获取进程的读写IO信息 | user: 某个进程用户态cpu消耗 |
| sys: 某个进程系统态cpu消耗 | ||
| total:某个进程总的cpu消耗 | ||
| mem: 某个进程的内存消耗百分比 | ||
| RSS: 某个进程的虚拟内存消耗,这是驻留在物理内存的一部分.它没有交换到硬盘.它包括代码,数据和栈 | ||
| read: 进程io读字节 | ||
| write:进程的io写字节 | ||
| nginx | nginx采集模块 |
2. JAVA应用监控 —— metric
注册监听点及监控周期,进行被监控指标的输出。
引用及使用方式:系统监控-Metric
3. 企业级集群监控 —— open-falcon
Java应用系统监控方法简介的更多相关文章
- 浅析IT系统监控方法和应用
浅析IT系统监控方法和应用 http://blog.csdn.net/zhangman117/article/details/35549363
- java枚举类Enum方法简介(valueof,value,ordinal)
Enum作为Sun全新引进的一个关键字,看起来很象是特殊的class, 它也可以有自己的变量,可以定义自己的方法,可以实现一个或者多个接口. 当我们在声明一个enum类型时,我们应该注意到en ...
- java sigar 系统监控
<dependency> <groupId>org</groupId> <artifactId>sigar</artifactId> < ...
- Metaspace 之二--Java 8的元空间(metaspace)、metaspace监控方法
很多开发者都在其系统中见过“java.lang.OutOfMemoryError: PermGen space”这一问题.这往往是由类加载器相关的内存泄漏以及新类加载器的创建导致的,通常出现于代码热部 ...
- Java系统监控(淘汰sigar)
Sigar是Hyperic-hq产品的基础包,是Hyperic HQ主要的数据收集组件.它用来从许多平台收集系统和处理信息. 这些平台包括:Linux, Windows, Solaris, AIX, ...
- Java如何实现系统监控、系统信息收集(转
Java如何实现系统监控.系统信息收集.sigar开源API的学习 系统监控(1) Jar资源下载:http://download.csdn.net/detail/yixiaoping/4903853 ...
- 获取当前应用的系统路径工具类和java的System.getProperty()方法介绍
java的System.getProperty()方法可以获取的值,如下: 对于Java程序,无论是未打包的还是打包的JAR或WAR文件,有时候都需要获取它运行所在目录信息,如何做到这一点呢? /** ...
- Linux系统监控命令及如何定位到Java线程
>>PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID ...
- [论文笔记] 一种Java遗留系统服务化切分和封装方法 (计算机学报, 2009)
李翔,怀进鹏,曾晋,高鹏. 一种Java遗留系统服务化切分和封装方法. 计算机学报, 32(9), 2009, p1084-1815 (gs:5) 1. 本文研究从Java遗留系统中切分并封装出Web ...
- Linux系统监控命令及定位Java线程
1.PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID.GID:~ ...
随机推荐
- Java内部类详解--成员内部类,局部内部类,匿名内部类,静态内部类
一.内部类基础 在Java中,可以将一个类定义在另一个类里面或者一个方法里面,这样的类称为内部类.广泛意义上的内部类一般来说包括这四种:成员内部类.局部内部类.匿名内部类和静态内部类.下面就先来了解一 ...
- 人人都会Kubernetes(二):使用KRM实现快速部署服务,并且通过域名发布
1. 上节回顾 上一小节<人人都会Kubernetes(一):告别手写K8s yaml,运维效率提升500%>介绍了KRM的一些常用功能,并且使用KRM的DEMO环境,无需安装就可以很方便 ...
- C++数据结构(树)
树是一种递归定义的数据结构,如果树中节点的各子树从左到右是有次序的,不能互换,则称该树为有序树,否则叫无序树. 关于树的节点: 节点拥有的子树的个数叫做节点的度 如果度为0,那么该节点叫做叶节点或终端 ...
- 【C】《C专家编程》阅读体会
[来源]https://mp.weixin.qq.com/s/0kmN5knql4yrOuUcnebwIQ
- CAP-BASE
- 百度网盘(百度云)SVIP超级会员共享账号每日更新(2023.12.18)
一.百度网盘SVIP超级会员共享账号 可能很多人不懂这个共享账号是什么意思,小编在这里给大家做一下解答. 我们多知道百度网盘很大的用处就是类似U盘,不同的人把文件上传到百度网盘,别人可以直接下载,避免 ...
- TiDB恢复部分表的方式方法
TiDB恢复部分表的方式方法 背景 今天同事告知误删了部分表. 因为是UAT准生产的环境, 所以仅有每天晚上11点的备份处理. 同时告知 昨天的数据也可以. 得到认可后进行了 TiDB的单表备份恢复. ...
- linux 内存盘的使用方式与验证
linux 内存盘的使用方式与验证 背景 某些情况下, 硬盘的写入是一个很大的瓶颈 使用 内存文件系统的方式应该能够极大的提高IO的速度. 内存盘的优点是比较快, 缺点就是数据不是持久化的. 其实还是 ...
- [转帖]一文理清 TiDB 与 MySQL 中的常用字符集及排序规则
https://tidb.net/blog/0c5b6025 1.1. 字符集与编码规则 字符集(character set)即为众多字符的集合.字符集为每个字符分配一个唯一的 ID,称为 &qu ...
- 【转帖】Ethernet 与 Infiniband的网络特性对比
一.两者定位 以太网(Ethernet): 应用最广泛,是最成熟的网络互联技术,也是整个互联网络大厦的基石,兼容性非常好,可实现不同的系统之间的互连互通 IB(Infiniband): 领域很专,作为 ...