系统性能监控:

确定系统运行的整体状态,基本定位问题所在

uptime命令

[root@localhost ~]# uptime
23:19:38 up 244 days, 3:39, 34 users, load average: 7.36, 7.81, 7.79

ps,获取服务器有多少逻辑核心:grep 'model name' /proc/cpuinfo | wc -l,一般情况下load average除以逻辑核心数 < 0.7 认为CPU压力不大

系统时间
时间从开机到现在的运行时间
连接数:每一个终端算一个连接
1,5,15分钟内的系统平均负载:运行队列中的平均进程数。

top命令

第一行同uptime
CPU、内存情况
每个进程占CPU的情况

可以知道哪个程序占用CPU最多

vmstat命令

可以统计系统的CPU,内存,swap,io等情况

CPU占用率很高,上下文切换频繁、说明系统中有线程正在频繁切换。

vmstat 1 4 指定采样频率和采样次数,每1秒采集1次,采集4次

[root@localhost ~]# vmstat 1 4
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
8 0 0 638328 31104 46136032 0 0 17 85 0 0 3 3 94 0 0
7 0 0 636872 31112 46136076 0 0 128 1416 46076 129603 11 10 79 0 0
7 0 0 636504 31112 46136308 0 0 0 996 45864 122568 11 10 79 0 0
13 0 0 635540 31112 46136380 0 0 0 2972 48854 127109 11 12 77 0 0

cs和us代表上下文切换。

pidstat命令

细致观察进程
需要安装: yum install -y sysstat
监控CPU
监控IO
监控内存

pidstat -p 58 -u 1 3

-p表示指定进程,进程id为58
-u指定采样CPU,每1秒采样一次,采集3次

[root@localhost ~]# pidstat -p 146603 -u 1 3
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 08/06/2018 _x86_64_ (32 CPU)
11:34:26 PM UID PID %usr %system %guest %CPU CPU Command
11:34:27 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
11:34:28 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
11:34:29 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
Average: 992 146603 0.00 0.00 0.00 0.00 - ssh

pidstat -p 58 -u 1 3 -t 
-t参数:查看进程中线程的使用情况

pidstat -p 58 -d 1 3 -t 
-d 查看磁盘io的情况

Java自带的工具

查看java程序运行细节,进一步定位问题

jps

列出java进程,类似于ps命令
-q可以指定jps只输出进程id,不输出类的短名称
-m参数可以用于输出传递给java进程(主函数)的参数
-l可以用于输出主函数的完整路径
-v可以显示传递给jvm的参数

支持远程监控(需要开启安全授权)

jps 192.168.1.10

安全授权

在远程机器%JAVA_HOME%/bin/目录下存储jstatd.all.policy文件,内容如下:

grant codebase "file:${java.home}/../lib/tools.jar" {
permission java.security.AllPermission;
};

然后在进入jstatd.all.policy所在目录下,通过如下的命令启动RMI服务:

./jstatd -J-Djava.security.policy=jstatd.all.policy 

或者

./jstatd -J-Djava.security.policy=jstatd.all.policy -J-Djava.rmi.server.hostname=192.168.22.249

jstat

jstat -gcutil 9统计gc信息:

说明:

图中显示,FGC一共有3次,用时547毫秒,平均一次gc占用时间为547/3=182毫秒,结合JVM运行时长来看这个full gc是否合理,比如这个数据是jvm启动了一天之后的数据,即一天3次full gc,且每次182毫秒,对于平均响应时间为1s的应用来说这完全没有问题;如果是1小时3次,应用的响应时间为几十毫秒,这个就有影响了,GC的时间消耗是否合理是相对的。

字段说明

S0 年轻代中第1个幸存区已使用的占当前容量百分比

S1 年轻代中第2个幸存区已使用的占当前容量百分比

E  年轻代中Eden已经使用的占当前容量的百分比

O  old代中Eden已经使用的占当前容量的百分比

P  perm代中Eden已经使用的占当前容量的百分比

YGC  JVM启动到采样时年轻代gc次数

YGCT JVM启动到采样时年轻代gc所用时间

FGC JVM启动到采样时old代(full gc)gc次数

FGCT JVM启动到采样时old代(full gc)gc所用时间

GCT JVM启动到采样时gc用的总时间

支持远程监控(需开启安全授权)

jstat -gcutil 1198@192.168.1.10

jinfo

可以用来查看正在运行的java应用程序的扩展参数,甚至支持在运行时,修改部分参数。
-flag <name> 打印指定JVM的参数值
-flag [+|-] <name> 设置指定JVM参数的布尔值
-flag <name>=<value>:设置指定JVM参数的值

显示了新生代对象晋升到老年代对象的最大年龄:
[root@localhost ~]# jinfo -flag MaxTenuringThreshold 2972
输出:-XX:MaxTenuringThreshold=15

显示是否打印GC详细信息:
[root@localhost ~]# jinfo -flag PrintGCDetails 23415
-XX:-PrintGCDetails (-号代表false)

运行时修改参数,控制是否输出GC日志(不用重启进程)
[root@localhost ~]# jinfo -flag +PrintGCDetails 23415
[root@localhost ~]# jinfo -flag PrintGCDetails 23415
-XX:+PrintGCDetails

jmap

3.1、生成java应用程序的堆快照和对象的统计信息
jmap -histo 23415 > /home/bgq/s.txt

[root@localhost ~]# cat /home/bgq/s.txt |less

num #instances #bytes class name
----------------------------------------------
1: 195451 21772752 [C
2: 82717 18440736 [B
3: 18116 16245400 [I

输出默认是占用空间大小(#bytes)倒序显示。

[I代表整数数组

3.2、Dump堆
jmap -dump:format=b,file=/home/bgq/heap.hprof 23415

dump完成之后,通过工具打开这个文件。比如mat工具

jstack

打印线程dump,注意一定要用该进程的启动用户去拉,否则会报 Unable to open socket file: target process not responding or HotSpot VM not loaded 错误。

-l 打印锁信息
-m 打印java和native的帧信息
-F 强制dump,当jstack没有响应时使用

打印120这个pid的线程信息
jstack 120 >> C:\a.txt

JStack 拉取的文件信息基本分为以下几个部分:
该拉取快照的服务器时间
JVM 版本
以线程 ID(即 tid)升序依次列出当前进程中每个线程的调用栈
死锁(如果有的话)
阻塞锁链
打开的锁链
监视器解锁情况跟踪
每个线程在等待什么资源,这个资源目前在被哪个线程 hold,尽在眼前。JStack 最好在压测时多次获取,找到的普遍存在的现象即为线程瓶颈所在。

JConsole

图形化监控工具
可以查看java应用程序的运行情况,监控堆信息,永久区使用情况,类加载情况等。

堆:新生代、老年代
非堆:堆以外的内存,包括code cache、compressed class space

Jvisual VM

比jconsole更强大的工具
多合一故障诊断和性能监控的可视化工具。

性能监控:找到占用CPU时间最长的方法
抽象器-->CPU

分析堆Dump

练习:
运行一个程序ThreadBlockMain,期望输出Hello, World,结果在程序运行后,程序卡死,没有预期输出

1、通过jps获取进程id号
2、打印进程的线程信息:jstack 2300 > C:\ts.txt
3、打开文件,查看,通过进程发现在等待一个socket receive

练习2:
java程序HoldCPUMain运行后,发现占用CPU很高,希望能找到原因。

1、通过jps获取HoldCPUMain的进程id号
2、uptime查看负载
3、top命令,查看java程序CPU占用率100%
4、pidstat -p 3455 1 3 -u -t
打印CPU的线程输出情况,发现某个线程3467,占用CPU特别高
3467转16进制:D8B(jstack获取的线程信息文件中,线程号以16进制呈现)
jstack 3455 > C:\ts.txt

然后根据jstack的线程调用信息,查看指定的代码行。

练习3:
死锁。

如何从jstack的输出中找出死锁。

看是不是有线程互相等待

使用jvisualvm、jmc远程监控JVM

https://blog.csdn.net/mn960mn/article/details/73958701

IBM HeapAnalyzer简介使用

https://blog.csdn.net/wwd0501/article/details/78657319

Java程序性能监控工具的更多相关文章

  1. SkyWalking分布式系统应用程序性能监控工具-上

    概述 微服务系统监控三要素 现在系统基本都是微服务架构,对于复杂微服务链路调用如下问题如何解决? 一个请求经过了这些服务后其中出现了一个调用失败的问题,如何定位问题发生的地方? 如何计算每个节点访问流 ...

  2. Java程序性能优化技巧

    Java程序性能优化技巧 多线程.集合.网络编程.内存优化.缓冲..spring.设计模式.软件工程.编程思想 1.生成对象时,合理分配空间和大小new ArrayList(100); 2.优化for ...

  3. 《Java程序性能优化:让你的Java程序更快、更稳定》

    Java程序性能优化:让你的Java程序更快.更稳定, 卓越网更便宜,不错的书吧

  4. [JAVA] java程序性能优化

    一.避免在循环条件中使用复杂表达式 在不做编译优化的情况下,在循环中,循环条件会被反复计算,如果不使用复杂表达式,而使循环条件值不变的话,程序将会运行的更快. 例子: import java.util ...

  5. JProfiler - Java的性能监控工具

    简介 JProfiler是一款Java的性能监控工具.可以查看当前应用的对象.对象引用.内存.CPU使用情况.线程.线程运行情况(阻塞.等待等),同时可以查找应用内存使用得热点,即:哪个对象占用的内存 ...

  6. Java程序性能定位工具-火焰图

    Java程序性能定位工具-火焰图 前言 Java火焰图是一种新的查看CPU利用率方式.今天就带大家一起使用来自Google大神的工具来生成火焰图.火焰图非常的直观,问题一目了然,希望有一天它能成为JA ...

  7. java程序性能优化

    一.避免在循环条件中使用复杂表达式 在不做编译优化的情况下,在循环中,循环条件会被反复计算,如果不使用复杂表达式,而使循环条件值不变的话,程序将会运行的更快. 例子: import java.util ...

  8. Java程序性能优化——让你的java程序更快、更稳定

    1.Java性能调优概述 1.1.Web服务器,响应时间.吞吐量是两个重要的性能参数. 1.2.程序性能的几个表现: 执行速度:程序的反映是否迅速,响应时间是否足够短 内存分配:分配是否合理,是否过多 ...

  9. 《Java程序性能优化》学习笔记 设计优化

    豆瓣读书:http://book.douban.com/subject/19969386/ 第一章 Java性能调优概述 1.性能的参考指标 执行时间: CPU时间: 内存分配: 磁盘吞吐量: 网络吞 ...

随机推荐

  1. 编写Java程序,使用JDialog构造登录窗体

    返回本章节 返回作业目录 需求说明: 实现思路: 定义用户信息实体类User. 创建LoginDemoStart主类,初始化UI. 从UI获取用户信息并保存到User实体. 实现代码:

  2. centos7 安装python3 小白教程-CV大法

    安装python3 centos7,默认系统自带python2.7的版本,这个版本被系统很多程序所依赖,所以不建议删除,如果使用最新的Python3那么我们知道编译安装源码包和系统默认包之间是没有任何 ...

  3. java -jar 指定logback.xml、application.yaml

    java -jar 指定logback.xml -Dlogging.config="C:\logbacs\logback.xml" 示例:java -jar   -Dlogging ...

  4. Python max()方法扩展:求字典中值最大的键

    重要的应该写在前面[捂脸]   场景一:仅求最大值对应的键,代码如下: >>> dic = {'A':4, 'B':2, 'C':3} >>> max_key = ...

  5. Flask_Flask-Migrate数据迁移扩展(十二)

    在开发过程中,需要修改数据库模型,而且还要在修改之后更新数据库.最直接的方式就是删除旧表,但这样会丢失数据.更好的解决办法是使用数据库迁移框架,它可以追踪数据库模式的变化,然后把变动应用到数据库中. ...

  6. Scrapy的Item_loader机制详解

    一.ItemLoader与Item的区别 ItemLoader是负责数据的收集.处理.填充,item仅仅是承载了数据本身 数据的收集.处理.填充归功于item loader中两个重要组件: 输入处理i ...

  7. 关于less使用初学者常犯错误

    1.多层嵌套 2.定义变量复用性不高 3.方法定义多余参数.

  8. Anaconda3+CUDA10.1+CUDNN7.6+TensorFlow2.6安装(Ubuntu16)

    欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...

  9. day 10 删除空白字符

    (1).有以下程序(大写变小写) (2).有以下程序,在[1]填写程序,使得程序正确运行. 分析:(*p)(int,int)是一个函数指针(一个指针[*p]指向的对象是一个函数),函数的形参是(int ...

  10. BERT-Pytorch版本代码pipline梳理

    最近在做BERT的fine-tune工作,记录一下阅读项目https://github.com/weizhepei/BERT-NER时梳理的训练pipline,该项目基于Google的Transfor ...