WinDbg 分析 .NET Dump 线程锁问题
在定位 .NET 应用程序中的高 CPU 占用问题时,WinDbg 是非常强大的工具之一,尤其配合 SOS 扩展使用可以快速锁定“忙线程”或死锁等问题。
本文将基于一次实际的分析流程,演示如何一步步定位由线程锁引起的 CPU 高占用。
1. 加载 SOS 扩展(针对 .NET)
首先,我们需要加载 SOS.dll。根据你所调试的 .NET 版本不同,使用 .loadby
指令时的模块名也不同:
.loadby sos clr
注意:
.NET Framework
使用的是clr.dll
,所以.loadby sos clr
正确;如果你调试的是
.NET Core
或.NET 5+
,对应模块可能是coreclr.dll
;可使用
lm
命令确认实际加载的模块名。
2. 查看每个线程的调用栈
查看所有线程的调用栈是分析的关键一步。我们使用以下命令:
~* k
这会列出所有线程的 原生调用堆栈(native stack)。
关注以下三类线程特征:
持续执行的线程(高 CPU 嫌疑线程)
栈顶函数是业务逻辑方法、算法处理、循环等,说明该线程在“忙”,是最需要关注的对象。
卡在等待(阻塞)状态的线程
以下函数说明线程被阻塞,可能在等待锁或资源:
WaitForSingleObject
Monitor.Enter
WaitOne
Sleep
找到等待的资源后,看正在等待什么,如果正在等待GC,则继续找谁在GC
找到在执行 GC 的线程
如果调用栈中包含以下函数,说明线程正在 GC 中:
clr!GCHeap::GarbageCollect
clr!SVR::gc_heap::gc1
clr!SVR::gc_heap::gc2
clr!SVR::gc_heap::gc3
clr!GCHeap::GarbageCollectGeneration
clr!SVR::GCHeap::GarbageCollect
clr!GCHeap::gc_thread_function
GCInterface::Collect
频繁GC会挂起线程,增加CPU消耗。
3. 分析具体线程
在上一步中,如果你发现某个线程(例如线程 28)调用栈活跃、函数栈持续变化,或者涉及 GC、锁等待,可以使用以下命令聚焦:
~28s
!clrstack
这将切换到线程 28 并显示它的托管调用栈,便于你进一步确认是否存在如下情况:
死循环或密集计算导致高 CPU;
一直等待某个锁对象,导致其他线程堆积;
某些资源释放不及时,导致线程频繁争抢。
总结
通过上述方法,我们可以初步判断线程是否因锁或其他因素导致 CPU 占用异常。在实际排查中,掌握如下三点尤为重要:
先宏观查看所有线程调用栈;
识别忙线程 / 等待线程/ GC线程 ;
进一步使用
!clrstack
分析托管调用栈。
这是一种稳定、高效的诊断思路,尤其适用于高 CPU 的 dump 分析场景。
WinDbg 分析 .NET Dump 线程锁问题的更多相关文章
- 利用windbg 分析IIS 的线程池w3wp程序多线程挂起问题
前几天有个朋友发个了在windows server 2008跑的IIS 跑的程序w3wp程序dmp,要我帮忙分析为何线程都挂起不运行 经过查阅资料用windbg可以调试可以输出线程的调用堆栈,但是准备 ...
- 【性能诊断】五、并发场景的性能分析(windbg简介及dump抓取)
windbg简介 Windbg是在windows平台下,强大的用户态和内核态调试工具.相比较于Visual Studio,它是一个轻量级的调试工具,所谓轻量级指的是它的安装文件大小较小,但是其调试功能 ...
- WinDbg分析Dump常用方法和命令
记录下自己使用WinDbg分析Dump时常用的一些方法和命令 !analyze -v //找出出错的堆 .exrc //找到程序崩溃的位置 !heap //打印出错函数的局部位置 !for_each_ ...
- WinDbg 蓝屏dump分析教程
一.WinDbg是什么?它能做什么? WinDbg是在windows平台下,强大的用户态和内核态调试工具.它能够通过dmp文件轻松的定位到问题根源,可用于分析蓝屏.程序崩溃(IE崩溃)原因,是我们日常 ...
- Windbg分析蓝屏Dump文件
一.WinDbg是什么?它能做什么? WinDbg是在windows平台下,强大的用户态和内核态调试工具.它能够通过dmp文件轻松的定位到问题根源,可用于分析蓝屏.程序崩溃(IE崩溃)原因,是我们日常 ...
- 使用 WinDbg 分析dump文件
步骤一: 生成dump文件. #include <Windows.h> #include <iostream> #include <DbgHelp.h> #incl ...
- 使用WinDbg分析蓝屏dump原因
大多数人或许都经历过系统蓝屏问题,然而大多数人不清楚该怎么处理蓝屏问题,这里主要对系统蓝屏做一些解释,同时介绍下蓝屏问题分析工具WinDbg分析蓝屏问题的一般步骤. 微软官方对蓝屏的定义是,当系统遇到 ...
- Windbg分析高内存占用问题
1. 问题简介 最近产品发布大版本补丁更新,一商超客户升级后,反馈系统经常奔溃,导致超市的收银系统无法正常收银,现场排队付款的顾客更是抱怨声声.为了缓解现场的情况, 客户都是手动回收IIS应用程序池才 ...
- windbg分析一次大查询导致的内存暴涨
项目上反馈了一个问题,就是在生产环境上,用户正常使用的过程中,出现了服务器内存突然暴涨,客户有点慌,想找下原因. 讲道理,内存如果是缓慢上涨一直不释放的话,应该是存在内存泄漏的,这种排查起来比较困难, ...
- 揪出“凶手”——实战WinDbg分析电脑蓝屏原因
http://www.appinn.com/blue-screen-search-code/ 蓝屏代码查询器 – 找出蓝屏的元凶 11 文章标签: windows / 系统 / 蓝屏. 蓝屏代码查询器 ...
随机推荐
- Shell - shell中的运算符
基本语法 使用案例 基本语法 $((运算式)) $[ 运算式 ] 使用案例 # 第一种写法 a=10 b=20 c=`expr ${a} + ${b}` echo "$c" # 第 ...
- 借Processing语言及IDE做DOS批处理的事务( 批量修改文件夹或文件的名字 )
一直想用Processing语言做一些批处理的事务,因为其自带的IDE功能紧凑易用,极度轻量,又加上Java语言的生态极具友好,处理一些windows相关操作完全可行,简单快捷. 这次就是用它做[批量 ...
- Vue3条件与列表渲染深度解析:实战技巧助你高效开发复杂界面
一.条件渲染的高阶应用 1.1 多分支条件渲染(v-if/v-else-if/v-else) <!-- 评分等级展示案例 --> <div v-if="score > ...
- 读论文-新闻推荐系统:近期进展、挑战与机遇的评述(News recommender system_ a review of recent progress, challenges, and opportunities)
前言 今天读的论文为一篇于2022年发表在"人工智能评论"(Artificial Intelligence Review)的论文,文章主要强调了NRS面临的主要挑战,并从现有技术中 ...
- Elasticsearch搜索引擎学习笔记(五)
搜索功能 数据准备 1.自定义词库 慕课网 慕课 课网 慕 课 网 2.新建立索引shop 3.建立mappings POST /shop/_mapping (7.x之前的版本:/shop/_mapp ...
- 万字解析Golang的map实现原理
0.引言 相信大家对Map这个数据结构都不陌生,像C++的map.Java的HashMap.各个语言的底层实现各有不同,在本篇博客中,我将分享个人对Go的map实现的理解,以及深入源码进行分析,相信耐 ...
- 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本地AI Agent
一.天价邀请码VS开源革命:打工人今夜无眠 昨夜科技圈被两个关键词刷屏:Manus激活码炒至5万元5,7,GitHub神秘项目OpenManus突然开源6,7.这场戏剧性对决的背后,是一场关于「A ...
- 设备管理笔记1-oee
什么是oee 类似于一种设备管理模型,如软件行业的质量模型.cmmi模型等 指标包括什么? 正常指标应该是多少,目前我们的指标为多少? 制造行业存在的6大问题分别是什么 指标包括什么? 包括 可用性性 ...
- excel 文件提示已受损 解决方案
1.打开office excel 2.python 语言save 方法导致,将后缀改为.xls 3.用WPS打开
- python 二级 标准库
1.turtle 函数 包括窗体函数.画笔状态.画笔运动函数 random库 3.time 时间处理.时间格式化.时间计时