[原]排错实战——通过对比分析sysinternals事件修复程序功能异常
缘起
最近,我们程序的某个功能在一台机器上不正常,但是在另外一台机器上却是正常的。代码是同一份,vs版本也一样(打的补丁也一样)。编译出来的程序在两台电脑上运行的结果就是不一样。惊不惊喜,意不意外?如果是你遇到了这种情况,你会怎么调查呢?:upside_down_face:
{% note info %}
说明:
为了跟大家分享这个问题,我事后在自己的机器上重新把整个过程梳理了一遍,并保存了process monitor抓取的事件文件,方便感兴趣的读者亲手做实验。
为了行文方便,下文把程序功能正常的电脑称作A,把程序功能不正常的电脑称作B。
{% endnote %}
排查问题
通过对比程序在两台电脑上的运行过程的不同点可以比较有效的解决这种问题。
下面是我的思路:
- 首先,排除代码不一致的问题。把
A上的代码拷贝到B上,编译,运行,功能不正常。 - 把
A上的整个Debug目录(程序所在的目录)拷贝到B上,运行,依然不正常。 - 对比两台电脑上的环境变量,排除两台电脑的环境变量不一致导致的问题(尤其是
PATH,会影响dll加载顺序)。
经过以上几步,问题还是没能得到解决。B应该还有某个(些)关键点跟A不一样。但是这个(些)关键点究竟是什么?我们应该怎么找到它(们)?这时候该本文的主角process monitor闪亮登场啦!
请出process monitor
在开始前,先跟各位读者介绍下process monitor的事件分类:
process monitor捕获的事件总共分为 5 类:
Registry Activity注册表相关事件(键和值的读写,创建,删除,枚举等)File System Activity文件系统相关事件(本地存储和远程文件系统相关事件)Network Activity网络相关事件(TCP和UDP网络活动)Process and Thread Activity进程及线程事件(进程和线程事件,模块加载)Profiling Event(我没用过,具体可参考书上的介绍)
为了方便大家获得更详细的介绍,特意从《Troubleshooting with the Windows Sysinternals Tools》(英文版)中截了一张图:

捕获Event data
首先,使用process monitor分别在A和B上捕获Event Data。这里不贴出使用process monitor捕获的过程了。操作很简单,在之前的文章([原]为IDA加载调试符号)里有录屏。
好了,拿到了Event Data( 点击下载我保存的Event Data ),接下来我们应该怎么对比呢?
对比分析Event Data
在对比前,我们应该过滤掉无关的事件(因为process monitor捕获到的事件实在是太多了),这里我只根据进程名进行了基本的过滤。
过滤完成后,我们从五类事件中的File System事件看起(没想到直接解决了问题,剩下几个不用看了:smirk:)。
对比图如下(左侧是A,右侧是B):

Wow, 从图中我们明显可以看出来,A成功加载了pgcell.ocx,B没有加载。有windows COM组件开发经验的读者一定想到了,B上没注册pgcell.ocx。
解决问题
知道问题的原因,剩下的事情就很好办了。在B上注册pgcell.ocx。注册成功后,在程序里重新执行对应的功能,一切正常。搞定收工。
为了方便对windows COM组件开发不熟悉的读者,这里给出注册脚本(#后面的是注释) 。
cd path/to/pgcell.ocx
regsvr32 pgcell.ocx
# regsvr32 -u pgcell.ocx # unregister pgcell.ocx
关于regsvr32的更多用法,可以直接运行regsvr32进行学习。在我机器上运行后的截图如下:

通过regsvr32给出的提示,相信聪明的你也可以自己写一个COM组件的注册和卸载工具。如果对这方面有兴趣,欢迎留言交流。
后记
最开始帮同事解决这个问题的时候,没有用process monitor,而是使用了process explorer。在继续阅读下面的文章前,请先停下来好好思考一下,如何使用process explorer排查此问题?
和使用process monitor一样,我们需要对比程序在A和B上有什么不同。话不多说,请看动态对比图:
A上的运行过程:

B上的运行过程:

我们可以发现,A上能成功加载pgcell.ocx,B却没有加载。
能使用process explorer解决这个问题,多少有运气的成分!因为这个问题恰巧是由于加载不上某个dll导致的。如果是由于其它原因(e.g. 读取不到某个关键文件),使用process explorer就没那么容易发现问题所在了。
总结
- 遇到问题,我们需要清晰的思路+合适的工具。
- 程序在一台电脑上运行正常,在另外一台上运行不正常。对比程序在两台电脑上的运行过程的不同点应该是解决这种问题的有效办法。
sysinternals系列工具,真的是排错神器!你值得拥有!- 一定要好好利用
process monitor的过滤功能!能不能有效的过滤出我们想要的事件是重中之重!
参考资料
- 《Windows Sysinternals实战指南》(中文版)
- The Case of the Unexplained: Windows Troubleshooting
阅读完今天的文章,你有什么收获吗?欢迎留言交流!
[原]排错实战——通过对比分析sysinternals事件修复程序功能异常的更多相关文章
- [原]排错实战——解救加载调试符号失败的IDA
原调试IDA排错troubleshootsymbolspdbsysinternalprocess monitor 缘起 最近想借助IDA逆向一个函数.在windows下,调试器(比如vs, windb ...
- [原]排错实战——使用process explorer替换任务管理器
原Aha总结注册表process explorersysinternalsprocess monitor 前言 一般,我们会使用任务管理器查看系统中有哪些进程正在运行,强制杀掉某个进程.可是系统自带的 ...
- [原]排错实战——VS清空最近打开的工程记录
原脚本how-toprocess monitorsysinternalsvsvisual studiovs2017vs2019注册表 缘起 vs有一个功能 -- 在起始页会显示最近打开的工程列表,方便 ...
- [原]排错实战——解决Tekla通过.tsep安装插件失败的问题
原总结调试排错troubleshootteklaprocess monitorsysinternals 缘起 最近同事使用.tsep安装Tekla插件的时候,Tekla提示该插件已经存在了,需要卸载后 ...
- 前端基本知识(一):W3C标准&&冒泡事件,捕获事件,W3C DOM对象模型,对比分析
W3C标准是万维网联盟, 其他的可以参考万维网版本的更新内容 一.W3C标准 二.W3C DOM事件 三.冒泡事件 四.捕获事件 一.W3C标准 其实网页是由三分部组成:1.结构(structure) ...
- 第15.17节 PyQt(Python+Qt)入门学习:PyQt图形界面应用程序的事件捕获方法大全及对比分析
老猿Python博文目录 老猿Python博客地址 按照老猿规划的章节安排,信号和槽之后应该介绍事件,但事件在前面的随笔<PyQt(Python+Qt)实现的GUI图形界面应用程序的事件捕获方法 ...
- Apache 流框架 Flink,Spark Streaming,Storm对比分析(一)
本文由 网易云发布. 1.Flink架构及特性分析 Flink是个相当早的项目,开始于2008年,但只在最近才得到注意.Flink是原生的流处理系统,提供high level的API.Flink也提 ...
- Spring Boot 揭秘与实战 源码分析 - 开箱即用,内藏玄机
文章目录 1. 开箱即用,内藏玄机 2. 总结 3. 源代码 Spring Boot提供了很多”开箱即用“的依赖模块,那么,Spring Boot 如何巧妙的做到开箱即用,自动配置的呢? 开箱即用,内 ...
- Spring Boot 实战与原理分析视频课程
Spring Boot 实战与原理分析视频课程 链接:https://pan.baidu.com/share/init?surl=PeykcoeqZtd1d9lN9V_F-A 提取码: 关注公众号[G ...
随机推荐
- 第二阶段scrum-9
1.整个团队的任务量: 2.任务看板: 会议照片: 产品状态: 消息收发在制作
- StackExchange.Redis.DLL 操作redis简化版
直接引入StackExchange.Redis.dll来操作redis using Newtonsoft.Json; using StackExchange.Redis; using System; ...
- 大数据之虚拟机配置和环境准备及hadoop集群搭建
一.VMnet1和VMnet8路由器 VMware-workstation软件选择默认安装时,会自动创建VMnet1和VMnet8路由器设备.(安装失败使用CCleaner清理vm软件) VMnet1 ...
- UVA - 1213 Sum of Different Primes (不同素数之和)(dp)
题意:选择k个质数,使它们的和等于n,问有多少种方案. 分析:dp[i][j],选择j个质数,使它们的和等于i的方法数. #pragma comment(linker, "/STACK:10 ...
- POJ 2239:Selecting Courses 选课
Selecting Courses Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9380 Accepted: 4177 ...
- Git - 版本管理 - 版本回退
1 在历史里找到 SHA-1 的值 0c6ab03dbbfe61e39af92dfe5450bf693a72b7d9 2 命令行里执行:git reset --hard 0c6ab03dbbfe61e ...
- [ERROR] Failed to execute goal org.apache.maven.plugins:maven-war-plugin:2.1.1:war
创建springboot项目,且不采用<parent>引入springboot时,pom.xml如下: <?xml version="1.0" encoding= ...
- 关于mybatis的<selectKey>中的keyColumn
<mapper namespace="com.dao.EmployeeDao"> <insert id="insert"> <se ...
- IDEA创建新文件时自动生成时间和作者
打开设置,打开下图的选项并且输入 /** * @author 你的名字 * @date ${DATE} ${TIME} */
- tensorflow中的神经网络笔记
1.NN----神经网络 2.CNN卷积神经网络 CNN网络一共有5个层级结构: 输入层 卷积层 激活层 池化层 全连接FC层 一.输入层 与传统神经网络/机器学习一样,模型需要输入的进行预处理操作, ...