“生产环境服务器变慢?如何诊断处理”

这是最近一些工作5年以上的粉丝反馈给我的问题,他们去一线大厂面试,都被问到了这一类的问题。

今天给大家分享一下,面试过程中遇到这个问题,我们应该怎么回答。

这个问题高手部分的回答,我整理到了一个10W字的文档里面,大家可以在我的主页加V领取。

来看看高手的回答。

高手:

生产环境服务器处理效率变慢,我认为主要会涉及到三个纬度:

  • CPU的利用率
  • 磁盘IO效率
  • 内存

CPU利用率过高或者CPU利用率过低,都会影响程序的处理效率。

利用率过高,说明当前服务器要处理的指令比较多,当CPU忙不过来的时候,指令的运算效率自然就会下降。

反馈在用户上的感受就是程序响应变慢了。

针对这个问题,我们可以使用top命令查询当前系统中占用CPU过高的进程,以及定位到这个进程中比较活跃的线程。

再通过jstack命令打印当前虚拟机的线程快照,然后根据快照日志排查问题代码。

如果CPU利用率过低,说明程序资源使用不够,可以增加线程数量提升程序性能。

程序运算过程中,会直接或者间接涉及到一些磁盘IO相关的操作,比如程序直接读写磁盘,

或者程序依赖的第三方组件涉及到磁盘的持久化存储,所以磁盘的IO效率也会对程序运行效率产生影响。

针对这个情况,可以使用iostat命令查看,如果磁盘负载较高,可以针对性的进行优化,比如

  • 借助缓存系统,减少磁盘IO次数
  • 用顺序写替代随机写入,减少寻址开销
  • 使用mmap替代read/write,减少内存拷贝次数

另外,系统IO的瓶颈可以通过CPU和负载的非线性关系体现出来。当负载增大时,系统吞吐量不能有效增大,

CPU不能线性增长,其中一种可能是IO出现阻塞。

最后,就是内存的瓶颈,内存作为一块临时存储数据的组件,所有CPU运算的指令都需要从内存中去读写。

内存的合理使用,可以减少应用和磁盘的直接IO频率,以及减少网络IO的频率,极大提升IO性能。

其次,作为Java应用程序的运行平台JVM,对于内存的合理分配,能够避免频繁的YGC和FULL GC。

内存使用率比较高的时候, 可以 dump 出 JVM 堆内存,然后借助 MAT 工具进行分析,

查出大对象或者占用最多的对象,以及排查是否存在内存泄漏的问题。

如果 dump 出的堆内存文件正常,此时可以考虑堆外内存被大量使用导致出现问题,

需要借助操作系统指令 pmap 查出进程的内存分配情况。

如果 CPU 和 内存使用率都很正常,那就需要进一步开启 GC 日志,分析用户线程暂停的时间、

各部分内存区域 GC 次数和时间等指标,可以借助 jstat 或可视化工具 GCeasy 等,

如果问题出在 GC 上面的话,考虑是否是内存不够、根据垃圾对象的特点进行参数调优、使用更适合的垃圾收集器;

分析 jstack 出来的各个线程状态。如果问题实在比较隐蔽,考虑是否可以开启 jmx,使用 visualmv 等可视化工具远程监控与分析。

总结

这个问题涉及到的知识面比较多,站在面试者的角度来说。

如果没有实际解决过类似问题,可以说一下自己的思路

只要大体思路和方向是对的,那在遇到类似问题的时候,可以利用网络上的资料

去逐步尝试解决。

大家记得点赞收藏加关注。

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Mic带你学架构

如果本篇文章对您有帮助,还请帮忙点个关注和赞,您的坚持是我不断创作的动力。欢迎关注「跟着Mic学架构」公众号公众号获取更多技术干货!

【Java面试】生产环境服务器变慢,如何诊断处理?的更多相关文章

  1. java面试-生产环境服务器变慢,谈谈你的诊断思路

    1.uptime:查询linux系统负载 11:16:16 系统当前时间 up 64 days, 19:23 从上次启动开始系统运行的时间3 users 连接数量,同一用户多个连接的时候算多个load ...

  2. Linux性能分析:生产环境服务器变慢,诊断思路和性能评估

    Linux性能分析:生产环境服务器变慢,诊断思路和性能评估 一.整机:top 二.CPU:vmstat 所有CPU核信息 每个进程使用CPU的用量分解信息 三.内存:free 四.硬盘:df 五.磁盘 ...

  3. java面试-生产环境出现CPU占用过高,谈谈你的分析思路和定位

    思路:结合Linux和JDK命令一起分析 1.用top命令找出CPU占比最高的进程 2.ps -ef|grep java|grep -v grep 或者jps -l进一步定位,得知是怎样一个后台程序惹 ...

  4. IBM Thread and Monitor Dump Analyzer for Java解决生产环境中的性能问题

    这个工具的使用和 HeapAnalyzer 一样,非常容易,同样提供了详细的 readme 文档,这里也简单举例如下: #/usr/java50/bin/java -Xmx1000m -jar jca ...

  5. 利用ansible-playbook从测试环境获取tomcat中java项目新版本发布到生产环境

    一.环境描述 安装有ansible的服务器:192.168.13.45 测试环境服务器:192.168.13.49 /home/app/api-tomcat/webapps/api.war为测试环境新 ...

  6. .NET C#微信公众号开发远程断点调试(本地远程调试生产环境代码)

    最近在做微信公众号开发,由于之前没有接触过,突然发现调试不方便,不方便进行断点跟踪调试.因为微信那边绑定的服务器地址必须是公网地址,但是还是想进行断点调试(毕竟这样太方便了,程序有Bug,一步步断点跟 ...

  7. [转]跳板机Jumpserve的生产环境配置

    6.跳板机Jumpserver]   Jumpserver是国内一款开源的轻便的跳板机系统,他们的官网:http://www.jumpserver.org/ 使用这款软件意在提高公司内部登录生产环境服 ...

  8. Rails的静态资源管理(四)—— 生产环境的 Asset Pipeline

    官方文档:http://guides.ruby-china.org/asset_pipeline.html http://guides.rubyonrails.org/asset_pipeline.h ...

  9. [转]Jumpserve跳板机的生产环境应用

    Jumpserver是国内一款开源的轻便的跳板机系统,他们的官网:http://www.jumpserver.org/ 使用这款软件意在提高公司内部登录生产环境服务器的便捷性,权限分配细化,以及后台管 ...

随机推荐

  1. Spring Ioc源码分析系列--Bean实例化过程(二)

    Spring Ioc源码分析系列--Bean实例化过程(二) 前言 上篇文章Spring Ioc源码分析系列--Bean实例化过程(一)简单分析了getBean()方法,还记得分析了什么吗?不记得了才 ...

  2. Python工程:ImportError: attempted relative import with no known parent package

    Python工程:ImportError: attempted relative import with no known parent package 解决方法: 1.对每个目录创建的时候都选择创建 ...

  3. 『忘了再学』Shell基础 — 24、Shell正则表达式的使用

    目录 1.正则表达式说明 2.基础正则表达式 3.练习 (1)准备工作 (2)*练习 (3).练习 (4)^和$练习 (5)[]练习 (6)[^]练习 (7)\{n\}练习 (8)\{n,\}练习 ( ...

  4. 用STM32玩OLED(显示文字、图片、动图gif等)

    目录 用STM32玩OLED(显示文字.图片.动图gif等) 1. 显示字符串 2. 显示中文 3. 显示图片 4. 显示动图 5. 总结测试 用STM32玩OLED(显示文字.图片.动图gif等) ...

  5. CentOS7及以下版本安装禅道

    由于是CentOS7以及以下系统,禅道已经集成了 Apache Nginx Mysql 服务,不需要我们再次安装搭建,我们只进行解压使用就好: 一.进行下载安装 1.在终端命令中输入以下命令确认系统是 ...

  6. [学习笔记]使用Docker+Jenkin自动化流水线发布.Net应用

    ​使用Docker容器方案可以快速安全地将项目部署到客户的服务器上,作为公司项目,需要解决两个问题: 1. 需要搭建一个私有的Docker仓库,以便安全的存储镜像 2. 需要一套自动化发布方案,实现代 ...

  7. JavaScript有哪些数据类型,它们的区别?

    基本数据类型:number.string.boolean.Undefined.NaN(特殊值).BigInt.Symbol 引入数据类型:Object NaN是JS中的特殊值,表示非数字,NaN不是数 ...

  8. 安装gitlab客户端

    1. 下载客户端软件包 https://pan.baidu.com/disk/home#/category?type=6&vmode=list 安装顺序: Git-2.13.3-64-bit. ...

  9. sql-DCL用户及权限管理及其他常用命令-mysql

    查看系统信息 SHOW PROCESSLIST -- 显示哪些线程正在运行 SHOW VARIABLES -- 显示系统变量信息 SELECT now(), user(), version(); -- ...

  10. 为什么不建议使用自定义Object作为HashMap的key?

    此前部门内的一个线上系统上线后内存一路飙高.一段时间后直接占满.协助开发人员去分析定位,发现内存中某个Object的量远远超出了预期的范围,很明显出现内存泄漏了. 结合代码分析发现,泄漏的这个对象,主 ...