原文:http://chuansongme.com/n/797172 背景 据XX部门兄弟反应, 其在将PHP从5.3.8 升级到5.5.13 时, 开始运行正常, 运行一段时间后, 系统负载变高,达到200%以上, 从netstat看到大量连接处在CLOSE_WAIT状态. 最终导致系统不可用, 将PHP 回滚到5.3. 8 后, 一切正常. php-fpm 配置文件除了由版本引起的差异外, 没做任何改变. 猜想 根据TCP关闭连接的流程图: 可以看到, 一个处于连通状态(ESTABLISHE…
原文:http://chuansongme.com/n/797172 背景 据XX部门兄弟反应, 其在将PHP从5.3.8 升级到5.5.13 时, 开始运行正常, 运行一段时间后, 系统负载变高,达到200%以上, 从netstat看到大量连接处在CLOSE_WAIT状态. 最终导致系统不可用, 将PHP 回滚到5.3. 8 后, 一切正常. php-fpm 配置文件除了由版本引起的差异外, 没做任何改变. 猜想 根据TCP关闭连接的流程图: 可以看到, 一个处于连通状态(ESTABLISHE…
关于top命令 经常问load average 参考:load average 定义(网易面试) jvm dump的使用 参考:Jvm dump jstack jmap jstat 介绍与使用(内存与线程) 以及使用jstack定位问题 查看端口:如何在Windows,Linux下查看JAVA端口占用情况(阿里) 问题现象: 1,top命令查询服务器负载达到2.0-5之间,tomcat的cpu使用率达到104% load average: linux系统中的Load对当前CPU工作量的度量.简单…
最近一个用户这边服务器运行四五天就会出现服务器负载很高的情况,原本正常是0.3~0.5左右  不正常的时候会达到3,重启机器就正常,开始以为是程序问题,后来在观察的时候把程序给杀掉了 然后重启,结果负载还是很高,于是挨个分析每个进程发现 查看当前正在运行的进程发现kipmi0进程占用率达到100%. 于是查了下这个进程的一些资料 google查不到多少资料,看到一篇说法:是一些平台接口的管理器.不敢贸然杀死,再查查资料. 看看专业的说法:kipmi is supposed to run with…
最近一个用户这边服务器出现服务器负载很高的情况,原本正常是0.3~0.5左右  不正常的时候会达到3,重启机器就正常,开始以为是程序问题,后来在观察的时候把程序给杀掉了 然后重启,结果负载还是很高,于是挨个分析每个进程发现 查看当前正在运行的进程发现kipmi0进程占用率达到100%. 于是查了下这个进程的一些资料 google查不到多少资料,看到一篇说法:是一些平台接口的管理器.不敢贸然杀死,再查查资料. 看看专业的说法:kipmi is supposed to run with low pr…
某些进程/服务消耗更多CPU资源(服务响应更多请求或存在某些应用瓶颈):发生比较严重的swap(可用物理内存不足):发生比较严重的中断(因为SSD或网络的原因发生中断):磁盘I/O比较慢(会导致CPU一直等待磁盘I/O请求): 绝对不要因表数据量小,sql语句随便写都行,随便join都不会出现性能瓶颈,决不能有这种思想.尽量避免join表 join表笛卡尔积如果要join表一定要把where条件写全,安全起见最好加个limit.一次请求读写的数据量太大,导致磁盘I/O读写值较大,例如一个SQL里…
业务背景 业务背景就是需要将多张业务表中的数据增量同步到一张大宽表中,后台系统基于这张大宽表开展业务,所以就开发了一个数据同步工具,由中间件采集binlog消息到kafka里,然后我去消费,实现增量同步. 生产环境发现的现象 在程序发布到生产环境时候,机器的CPU使用率立马被打到100%, load还在不停的上升,开始机器的配置是4核心8G内存,load可以到21,通过topc命令查看load average的三个值都大于20,说明机器非常的繁忙. 排查步骤及手段 1.  通过top命令查看到C…
# top top - 21:21:51 up 207 days, 1:30, 5 users, load average: 0.90, 0.79, 1.62 Tasks: 249 total, 1 running, 246 sleeping, 2 stopped, 0 zombie %Cpu(s): 49.2 us, 2.0 sy, 0.0 ni, 48.1 id, 0.0 wa, 0.0 hi, 0.6 si, 0.0 st 如果load average很大(参考核数),则系统负载很高,其中…
转自:http://cizixs.com/2018/01/13/linux-udp-packet-drop-debug?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io 最近工作中遇到某个服务器应用程序 UDP 丢包,在排查过程中查阅了很多资料,总结出来这篇文章,供更多人参考. 在开始之前,我们先用一张图解释 linux 系统接收网络报文的过程. 首先网络报文通过物理网线发送到网卡 网络驱动程序会把网络中的报文读出来放到…
1:load Average 1.1:什么是Load?什么是Load Average?    Load 就是对计算机干活多少的度量(WikiPedia:the system Load is a measure of the amount of work that a compute system is doing)    简单的说是进程队列的长度.Load Average 就是一段时间(1分钟.5分钟.15分钟)内平均Load.[参考文章:unix Load Average Part1:How…