整体复盘: 一个不算普通的周五中午,同事收到了大量了cpu异常的报警.根据报警表现和通过arthas查看,很明显的问题就是内存不足,疯狂无效gc.而且结合arthas和gc日志查看,老年代打满了,gc不了一点.既然问题是内存问题,那么老样子,通过jmap和heap dump 文件分析. 不感兴趣的可以直接看结论 通过jmap命令查看的类似下图,并没有项目中明显的自定义类,而占空间最大的又是char数组,当时线上占900M左右,整个老年代也就1.8个G:此时dump文件同事还在下载,网速较慢. 通