[原]调试实战——使用windbg调试excel启动时死锁
前言
这是几年前在项目中遇到的一个死锁问题,在博客园发布过。我对之前的笔记进行了整理重新发布于此。
本文假设小伙伴们知道一些基本概念,比如什么是.dump
文件(转储文件,进程在某一时刻的快照),什么是windbg
(windows
下的调试利器),windbg
的基本用法,调用栈,调用约定,等等。
背景介绍
我们的程序会把dll
注入到其它进程,然后后调用SetWinEventHook
安装进程内钩子。然后专门开启一个线程来分发监听到的事件信息,并在该线程内会获取IAccessible
接口并使用该接口获取感兴趣的属性(e.g. 按钮的标题,按钮的位置等等)。运行我们的程序后,再启动excel
,有时候会导致excel
卡死,本文分析的.dump
文件就是其中一次卡死时抓取的。背景介绍完毕,下面开始分析.dump
。
问题分析
首先,我们用windbg打开.dump
文件,因为当时没截图,这里就不放图了。
因为是UI
线程卡死,而且一般情况下,第一个线程就是UI
线程,所以我们使用~0s
命令来切换到UI
线程。
然后用kv
命令列出调用栈,因为比较长,这里只用了kv10
,列出前16
个栈帧(windbg
默认是16
进制)。
我们发现0
号线程进入关键段时卡住了,在等待值为0x544
的句柄,猜测应该是关键段内部的LockSemaphore
(类型为的event
,可以通过!handle 0x544
来验证,之前忘记截图了,这里就不放图了),我们可以用命令!cs 76b18770
来观察关键段76b18770
的内容。
通过OwningThread
字段我们可以知道关键段76b18770
被线程0x000001ac
占用着,而0
号线程的线程id
是0x00000de4
。
我们可以通过? $tid
来观察当前线程的id
(因为我们之前用~0s
切换到0
号线程了,所以观察到的是0
号线程对应的id
)
我们切换到线程id
为0x000001ac
的线程看看, 可以使用~~[0x000001ac]s
来根据线程id
切换线程。输入~~[0x000001ac]s;kv
从上图可知,线程0x000001ac
正是我们新建的线程。从调用栈可知,本线程正在取name
属性。但是因为某些原因触发了异常!frame 2
表示正在调用SuspendThread
挂起句柄为fffffffe
的线程!也就是当前线程!!!我们可以反汇编KERNELBASE!GetCurrentThread
来验证。输入uf KERNELBASE!GetCurrentThread
小结
0
号线程尝试进入关键段76b18770
,而关键段76b18770
正在被线程id
为0x000001ac
的线程占用着,该线程又由于某些异常将自己挂起了!于是:bomb:!死锁了!!!
提示
windbg中有一个很有用的命令可以帮助我们快速找到死锁的关键段!输入!cs -l
我们也可以从上图中看到线程0x000001ac
拥有着关键段76b18770
。
后记
windbg可谓是windows
下分析各种疑难杂症的神兵利器,熟练掌握windbg是每一个优秀的windows
开发人员必备的技能!而掌握windbg中的各种命令是掌握windbg的基础。
参考资料
- 《格蠹汇编》
- windbg帮助文件
[原]调试实战——使用windbg调试excel启动时死锁的更多相关文章
- [原]调试实战——使用windbg调试TerminateThread导致的死锁
原调试debugwindbg死锁deadlock 前言 项目里的一个升级程序偶尔会死锁,查看dump后发现是死在了ShellExecuteExW里.经验少,不知道为什么,于是在高端调试论坛里发帖求助, ...
- [原]调试实战——使用windbg调试DLL卸载时的死锁
原调试debugwindbg死锁deadlock 前言 最近我们的程序在退出时会卡住,调查发现是在卸载dll时死锁了.大概流程是这样的:我们的dll在加载的时候会创建一个工作线程,在卸载的时候,会设置 ...
- [原]调试实战——使用windbg调试崩溃在ole32!CStdMarshal::DisconnectSrvIPIDs
原调试debugwindbg崩溃crash 前言 最近程序会不定期崩溃,很是头疼!今晚终于忍无可忍,下决心要干掉它!从之前的几个相关的dump可以猜到是有接口未释放导致的问题,但没有确认到底是哪个接口 ...
- [原]调试实战——使用windbg调试崩溃在ComFriendlyWaitMtaThreadProc
原调试debugwindbgcrash崩溃COM 前言 这是几年前在项目中遇到的一个崩溃问题,崩溃在了ComFriendlyWaitMtaThreadProc()里,没有源码.耗费了我很大精力,最终通 ...
- [原]excel启动时死锁
项目中遇到的一个死锁问题! 代码大概如下: 调用SetWinEventHook安装了进程内钩子,dll注入到excel进程后,专门开启一个线程来分发监听到的事件信息,并在该线程内会获取IAcces ...
- .NET高级调试系列-Windbg调试入门篇
Windbg是.NET高级调试领域中不可或缺的一个工具和利器,也是日常我们分析解决问题的必备.准备近期写2篇精华文章,集中给大家分享一下如果通过Windbg进行.NET高级调试. 今天我们来一篇入门的 ...
- 【转】WinDbg调试器:启动程序时自动连接调试器方法
当我们调试服务进程或子进程时,无法直接用调试加载进程的方式启动,此时需要在启动程序时自动连接调试器方法: 第一步:注册表展开到HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft ...
- Windbg调试命令详解
作者:张佩][原文:http://www.yiiyee.cn/Blog] 1. 概述 用户成功安装微软Windows调试工具集后,能够在安装目录下发现四个调试器程序,分别是:cdb.exe.ntsd. ...
- Windbg调试命令详解(1)
转载注明>> [作者:张佩][镜像:http://www.yiiyee.cn/Blog] 1. 概述 用户成功安装微软Windows调试工具集后,能够在安装目录下发现四个调试器程序,分别是 ...
随机推荐
- git登录账号密码错误remote: Incorrect username or password (access token)
git提交时弹框让输入用户和密码,不小心输入错误了 再次提交 一直就提示 remote: Incorrect username or password 错误了,也不弹框要重新输入 解决方法 win1 ...
- python控制鼠标键盘
1.安装类库 pip install pyautogui 2.代码: import pyautogui,time,random pyautogui.PAUSE = pyautogui.FAILSAFE ...
- group_concat用法以及字符串太长显示不全
由于group_concat默认的长度是1024,所以要将最大长度修改 首先执行 SET SESSION group_concat_max_len = 10240;#一次查询有效 然后再进行拼接 se ...
- Python笔记_第五篇_Python数据分析基础教程_前言
1. 前言: 本部分会讲解在Python环境下进行数值运算.以NumPy为核心,并讲解其他相关库的使用,诸如Matplotlib等绘图工具等. C.C++和Forttran等变成语言各有各的优势,但是 ...
- springcloud之Eureka上
0 环境 系统环境:win10 编辑器:IDEA 1 注册中心 Eureka是springcloud中的注册中心.原因: 当是单体应用 类似一条直线 随着项目越来越大 系统拆分 类似那个藕(模块间相互 ...
- vue 动画原理 part1
Vue动画原理 增加和删除css增加样式实现一个过渡效果也就是动画效果 1.需要动画效果的标签外包裹一个transition标签 会被自动分析css样式,然后自动构建一个动画流程 transition ...
- Vue.js——6.创建组件
Vue组件组件就是为了拆分Vue实例的代码量,能够不同的功能定义不同的组件创建组件的方法 1. // 创建组件 let com1=Vue.extend({ template:'<h1>he ...
- Linux 基本操作学习
Linux 学习 虚拟机 (Virtual Machine) 指通过软件模拟的具有完整硬件系统功能的,运行再一个完全隔离环境中的完整计算机系统 常用 Linux 命令 命令 对应英文 作用 ls li ...
- Springboot注解--@Controller和@RestController的区别
1.使用@Controller 注解,在对应的方法上,视图解析器可以解析return 的jsp,html页面,并且跳转到相应页面:若返回json等内容到页面,则需要加@ResponseBody注解 2 ...
- Java 开发者必须了解的 16 个Java 顶级开源项目!
本文已经收录自笔者开源的 JavaGuide: https://github.com/Snailclimb/JavaGuide ([Java学习+面试指南] 一份涵盖大部分Java程序员所需要掌握的核 ...