重新整理 .net core 实践篇 ———— linux上性能排查 [外篇]
前言
该文的前置篇为:
https://www.cnblogs.com/aoximin/p/16839830.html
本文介绍性能排查。
正文
上一节是出现错误了,如何去排查具体问题。
这一节介绍一下性能排查。
还是上文的例子作为演示:https://buggyambfiles.blob.core.windows.net/bin/buggyamb_v1.1.zip
项目地址:https://github.com/ahmetmithat/buggyamb
本文实验的还是lldb 和 sos。
对比一下cpu 情况。
实验实施条件:

请求前:

点击请求后:

这样对比还是很大的哈。
那么我们来看下啥子情况吧。
查看进程名:

那么当cpu 高的时候进行抓取,一般抓取两个,两个间隔10秒左右。
为什么抓取两个呢? 因为好对比作用,更好定位,这个多实验实验就清楚了。
抓取命令:
/usr/share/dotnet/shared/Microsoft.NETCore.App/3.1.30/createdump 108232 -f /tmp/coredump.manual.1.%d
/usr/share/dotnet/shared/Microsoft.NETCore.App/3.1.30/createdump 108232 -f /tmp/coredump.manual.2.%d
两个命令间隔10秒。
我们知道这个createdump 是 dotcore runtime 自带的。
那么怎么知道他的位置呢?

这样可以查找到位置。

可以看到10秒后内存升高了。
那么就可以上一章的内容了,进入lldb。
lldb --core coredump.manual.1.108232
然后查看线程:

看这个线程,发现和其他GC mode 不一样。
那么就有一个东西需要科普了,分别是cooperative 和 preemptive。
如果线程的 GC 模式设置为 “抢占”,则表示 GC 可以随时挂起此线程。 相比之下,协作模式意味着 GC 必须等待线程切换到抢占模式,然后才能挂起它。 当线程运行托管代码时,它处于协作模式。
这句话什么意思呢? 就是说这个线程在占用cpu的意思。那么cpu 高就应该看这个东西了。
setthread 14 然后切到这个线程。 这里就不解释了,都是上一章的东西。
然后调用一下clrstack。

然后来看一下干了什么?

感觉是在做字符串拼接啊。
那么这个时候是会造成cpu高和内存高的,那么要证明自己的猜想。
使用dso 查看一下。
Displays all managed objects found within the bounds of the current stack.

看下这个string,为什么看这个呢?因为这个string,和System.Data.DataRow 比较近,这个可以学习汇编可能跟容易理解。

查看了一下这个倒是有100m。
读取一下内存,看下里面是什么?

那么我们知道,第二次转储文件的时候内存是上述了的。
那么同样的操作在第二个里面执行:
lldb --core /tmp/coredump.manual.2.108232
setthread 15
dso

这里已经变成了string[]
用dumparray 00007f48e538a4b0 查看一下这个string[] 对象是啥?

看下第一个的string 对象的情况:

读取一下内存:
memory read -c 384 00007f48c3bc8f68

这里就基本确认问题了。
但是这样去定位问题,其实是有点慢的。而且发现,这个定位在cpu 倒是一个不错的选择,但是定位内存显得不那么合理。
因为cpu不高的情况,但是内存高的情况,这个时候肯定就是有很多碎片没有回收,上面查的情况是根据执行去判断的。
统计的方法定位问题是比较快的。
两个里面查看统计:
dumpheap -stat
第一个:

第二个:

发现这个system.string 两个都很大,且变多了,而DataRow 也不少。
但是这里涨的又不成比例,比如这里对象涨了几百,但是内存涨了200m。
这个时候可能就怀疑 大型对象堆 (LOH) 的问题了。
那么查一下大于85000字节的数据统计。
dumpheap -stat -min 85000
第一个:

第二个:

运行 dumpheap -stat -min 85000 -live。 此命令仅显示根于某处的对象。 在此示例中,只有正确的对象实例 string 位于 LOH 中。
-live 就是活跃的意思,也就是应用程序正在使用的,不会被GC的。

这里有4个,看下这4个是啥吧。

然后查看一个的内存:

这样就定位到了。
但是还得查看一下这个对象位置在哪? 怎么办呢?用SOS的命令:gcroot

这个是源代码内部的,看的不清楚。
使用-all

这样就直接定位到行了。
原因就是string+=string,等于String.Concat(System.String[]) 造成大量string 对象复制堆积。
结
下一节介绍procDump 和 dotnet-dump,procDump 这个挺好用的,dotnet-dump 更为方便。基本是必学的。
重新整理 .net core 实践篇 ———— linux上性能排查 [外篇]的更多相关文章
- 重新整理 .net core 实践篇 ———— linux上排查问题 [外篇]
前言 简单介绍一下在排查问题.献给初学者. 该文的前置篇: https://www.cnblogs.com/aoximin/p/16838657.html 正文 什么是linux系统 linux 是基 ...
- 重新整理 .net core 实践篇 ———— linux上排查问题实用工具 [外篇]
前言 介绍下面几个工具: Lldb createdump dotnet-dump dotnet-gcdump dotnet-symbol Procdump 该文的前置篇为: https://www.c ...
- 重新整理 .net core 实践篇 ———— linux 上线篇 [外篇]
前言 简单整理一个linux 简单上线. 这个是该系列的外篇,该系列继续更新.献给刚学的人. 正文 安装实例 dotnet new webapp -n AspNetCoreDemo -o firstw ...
- 重新整理 .net core 实践篇————配置应用[一]
前言 本来想整理到<<重新整理.net core 计1400篇>>里面去,但是后来一想,整理 .net core 实践篇 是偏于实践,故而分开. 因为是重新整理,那么就从配置开 ...
- Linux上性能异常定位以及性能监控
引言:大多数的服务都是跑在Linux上的,Linux现在也已经到了一个很广泛的应用,但是仍然会有很多问题出现,我们就来讨论下我们性能监控的指标,性能监控无非就是从I/O,内存,CPU,TCP连接数,网 ...
- 重新整理 .net core 实践篇————依赖注入应用[二]
前言 这里介绍一下.net core的依赖注入框架,其中其代码原理在我的另一个整理<<重新整理 1400篇>>中已经写了,故而专门整理应用这一块. 以下只是个人整理,如有问题, ...
- Node.js~在linux上的部署~外网不能访问node.js网站的解决方法
这是上一篇node.js部署到linux上的后续文章,当我们安装完node.js之后,建立了sailsjs的网站,然后在外面电脑上无法访问这个网站,这个问题我们如何去解决? 解决思路: 查看linux ...
- 重新整理 .net core 实践篇————依赖注入应用之援军[四]
前言 介绍第三方依赖注入框架Autofac,看看为我们解决什么问题. 下面介绍4个点: 命名注册 属性注册 aop 注入 子容器命名 正文 为什么我们需要使用第三方框架?第三方框架为我们做了什么?第三 ...
- 重新整理 .net core 实践篇—————服务与配置之间[十一二]
前言 前面基本介绍了,官方对于asp .net core 设计配置和设计服务的框架的一些思路.看下服务和配置之间是如何联系的吧. 正文 服务: public interface ISelfServic ...
随机推荐
- D - Distinct Trio
D - Distinct Trio 题意:求三个数个各不相同的数目. 题解:正面考虑比较困难,可以反向思考,在总值上减去不符合的即可 #include<bits/stdc++.h> usi ...
- 第十章 Kubernetes的CNI网络插件--flannel
1.简介 1.1前言 Kubernetes设计了网络模型,但却将它的实现讲给了网络插件,CNI网络插件最重要的功能就是实现Pod资源能够跨主机通信 常见的CNI网络插件如下: Flannel: Cac ...
- python 数据挖掘模块学习
项目中用到的模块 API # 模块: import pandas as pd import numpy as np from scipy.optimize import curve_fit numpy ...
- java的URI和URL的关系
java的URI和URL到底是什么 在我们做开发时,经常有URI和URL弄混的问题,如果当时直接看URI和URL的源码就不可能弄混.首先我总结一下URI和URL的关系:他们的关系是:URL是一种特殊的 ...
- Vue3 封装 Element Plus Menu 无限级菜单组件
本文分别使用 SFC(模板方式)和 tsx 方式对 Element Plus el-menu 组件进行二次封装,实现配置化的菜单,有了配置化的菜单,后续便可以根据路由动态渲染菜单. 1 数据结构定义 ...
- containerd使用
Docker CLI 工具提供了需要增强用户体验的功能,containerd 同样也提供一个对应的 CLI 工具:ctr,不过 ctr 的功能没有 docker 完善,但是关于镜像和容器的基本功能都是 ...
- nacos基础知识理解
概念 Nacos是阿里巴巴开源的一款支持服务注册与发现,配置管理以及微服务管理的组件.用来取代以前常用的注册中心(zookeeper , eureka等等),以及配置中心(spring cloud c ...
- 使用docker-compose方式部署es和kibana以及cerebro
使用的镜像可以从这个网站查看最新的:https://hub.docker.com/ 参考极客时间上的教程转发来的 使用步骤:安装docker和docker-compose 运行: docker-com ...
- PAT (Basic Level) Practice 1014 福尔摩斯的约会 分数 20
大侦探福尔摩斯接到一张奇怪的字条: 我们约会吧! 3485djDkxh4hhGE 2984akDfkkkkggEdsb s&hgsfdk d&Hyscvnm 大侦探很快就明白了,字 ...
- 从SVN导出项目出现的乱码问题
解决的方法很简单,只需要将Eclipse的编码标准设置为UTF-8即可 1.Window->Preferences->General->Workspace 面板Text file ...