一:背景

1. 讲故事

昨天在园里的编辑头条看到 精致码农大佬 写的一篇题为:[C#.NET 拾遗补漏]10:理解 volatile 关键字 (https://www.cnblogs.com/willick/p/13889006.html) 的文章,大概就是说在 多线程环境下,一个在debug不出现,在release中出现的bug,原文代码如下:


public class Worker
{
private bool _shouldStop; public void DoWork()
{
bool work = false;
// 注意:这里会被编译器优化为 while(true)
while (!_shouldStop)
{
work = !work; // do sth.
}
Console.WriteLine("工作线程:正在终止...");
} public void RequestStop()
{
_shouldStop = true;
}
} public class Program
{
public static void Main()
{
var worker = new Worker(); Console.WriteLine("主线程:启动工作线程...");
var workerTask = Task.Run(worker.DoWork); // 等待 500 毫秒以确保工作线程已在执行
Thread.Sleep(500); Console.WriteLine("主线程:请求终止工作线程...");
worker.RequestStop(); // 待待工作线程执行结束
workerTask.Wait();
//workerThread.Join(); Console.WriteLine("主线程:工作线程已终止");
}
}

文中分析这个bug是因为在 release 环境下,jit做了 while (!_shouldStop) -> while(true) 的代码优化。

2. 我的质疑

为什么我对这个问题比较敏感呢?第一:这是一个经典的问题,第二:我在 2017-03-20 也写过一篇这样的文章: 享受release版本发布的好处的同时也应该警惕release可能给你引入一些莫名其妙的大bug (https://www.cnblogs.com/huangxincheng/p/6585907.html) ,那篇文章我分析是因为 cpu缓存 和 内存 两者之间不一致导致的脏读,显然和大佬的结论大相径庭,而且两篇文章都存在一个问题,就是草率的下结论,并没有拿出一个完整的证据链来证明真的是这样, 这篇文章的目的就是试着拿出我认为的证据链。

二:真的被优化为 while(true) 了吗

1. 从两次编译阶段中寻找答案

大家应该都知道代码会经历两个阶段的编译: 第一阶段:编译器会把 C# code 编译成 MSIL 代码 ,第二阶段: CLR 会启动 JIT 将 MSIL 编译成机器代码,画一张图如下:

既然大佬说被优化成 while(true) 了,那意思就是说要么在 MSIL 中被优化,要么在 机器码 中被优化,这里我可以用 ILSpy 和 Windbg 去挖一挖,看看大佬说的是否正确?

2. 用 ILSpy 查看 MSIL 是否被优化

把项目编译成 release 模式,直接查看 DoWork() 的MSIL,如下所示:


.method public hidebysig
instance void DoWork () cil managed
{
// Method begins at RVA 0x2048
// Code size 28 (0x1c)
.maxstack 2
.locals init (
[0] bool work
) IL_0000: ldc.i4.0
IL_0001: stloc.0
IL_0002: br.s IL_0009
// loop start (head: IL_0009)
IL_0004: ldloc.0
IL_0005: ldc.i4.0
IL_0006: ceq
IL_0008: stloc.0 IL_0009: ldarg.0
IL_000a: ldfld bool ConsoleApp1.Worker::_shouldStop
IL_000f: brfalse.s IL_0004
// end loop IL_0011: ldstr "工作线程:正在终止..."
IL_0016: call void [System.Console]System.Console::WriteLine(string)
IL_001b: ret
} // end of method Worker::DoWork

从这句: ldfld bool ConsoleApp1.Worker::_shouldStop 可看出,代码并没有做任何优化,有点遗憾继续看看第二阶段。

3. 使用 windbg 查看 机器码 是否被优化

很显然机器码给大家看也看不懂,只能看被 JIT 编译成 机器代码 的 汇编代码,废话不多说,生成一个 dump 文件.

  • 用 name2ee 查看 DoWork 的方法描述符

0:011> !name2ee ConsoleApp1!Worker.DoWork
Module: 00007ffc8fdaf7e0
Assembly: ConsoleApp1.dll
Token: 0000000006000001
MethodDesc: 00007ffc8fdd3a50
Name: ConsoleApp1.Worker.DoWork()
JITTED Code Address: 00007ffc8fd17500

JITTED Code Address: 00007ffc8fd17500 可以看到,DoWork 已经被 JIT 编译过了,好事情。

  • 用 !U 查看 DoWork 的反汇编

对照代码图可以看到

  • ecx 寄存器 存放着 _shouldStop 值.
  • eax 寄存器 存放着 work 值

既然有两个寄存器存放着两个值,也就说明 while (!_shouldStop) -> while(true) 这个说法是站不住脚的。。。 那真相是什么呢? 我试着揭晓。

三:我所谓的真相

1. 验证寄存器的值

很明显当前的程序正在死循环,说明_shouldStop变量此时肯定是false,为了验证是否正确,通过 r 命令查看一下此时寄存器的值。


0:011> r ecx
ecx=0

2. 验证内存中的 _shouldStop 的值

要想验证内存中的 _shouldStop 是否已经为 true,最简单的办法就是去 托管堆 找 Work 对象,看看它的实例变量 _shouldStop 是否为 true 即可。


0:011> !dumpheap -stat
Statistics:
MT Count TotalSize Class Name
00007ffc8fdd3a90 1 24 ConsoleApp1.Worker 0:011> !dumpheap -mt 00007ffc8fdd3a90
Address MT Size
000001ee59f4abd8 00007ffc8fdd3a90 24 0:011> !do 000001ee59f4abd8
Name: ConsoleApp1.Worker
MethodTable: 00007ffc8fdd3a90
EEClass: 00007ffc8fdccda8
Size: 24(0x18) bytes
File: E:\net5\ConsoleApp1\ConsoleApp1\bin\x64\Release\netcoreapp3.1\ConsoleApp1.dll
Fields:
MT Field Offset Type VT Attr Value Name
00007ffc8fcd71d0 4000001 8 System.Boolean 1 instance 1 _shouldStop

从最后一行代码可以看到: _shouldStop =1 , 证明内存中的 _shouldStop 确实为 true,没毛病!

3. 整体思路

到这里是不是已经非常清晰了,由于while循环太频繁了,release做了代码优化,将 _shouldStop 的值直接放在了 ecx 寄存器中, 当B线程执行 _shouldStop=true 更新到内存的时候,并没有什么通知机制,导致A线程在不知情的情况下一直读自己的 ecx 寄存器的值0,这时候就脏读了,脑子里是不是有一张蓝图? 大概就像下面这样:

思想知道了,解决这个问题也就简单了,给 _shouldStop 打上 volatile 标记,让cpu每次都到内存中取 _shouldStop 值即可,


private volatile bool _shouldStop;

然后再看 Dowork 的反汇编:

为了更加可视化,来张对比图,很明显可以看到, volatile之前是直接取值比较,volatile之后是取偏移地址上的值比较,这就是真相吧!

四:总结

总的来说还是脏读引起的问题,刚好也补充了之前文章未寻找真相的一个遗憾吧,也感谢 精致码农大佬 原创输出。

更多高质量干货:参见我的 GitHub: dotnetfly

对精致码农大佬的 [理解 volatile 关键字] 文章结论的思考和寻找真相的更多相关文章

  1. 对 精致码农大佬 说的 Task.Run 会存在 内存泄漏 的思考

    一:背景 1. 讲故事 这段时间项目延期,加班比较厉害,博客就稍微停了停,不过还是得持续的技术输出呀! 园子里最近挺热闹的,精致码农大佬分享了三篇文章: 为什么要小心使用 Task.Run [http ...

  2. Java并发专题(三)深入理解volatile关键字

    前言 上一章节简单介绍了线程安全以及最基础的保证线程安全的方法,建议大家手敲代码去体会.这一章会提到volatile关键字,虽然看起来很简单,但是想彻底搞清楚需要具备JMM.CPU缓存模型的知识.不要 ...

  3. 深入理解volatile关键字

    Java内存模型 想要理解volatile为什么能确保可见性,就要先理解Java中的内存模型是什么样的. Java内存模型规定了所有的变量都存储在主内存中.每条线程中还有自己的工作内存,线程的工作内存 ...

  4. 彻底理解volatile关键字

    1. volatile简介 在上一篇文章中我们深入理解了java关键字,我们知道在java中还有一大神器就是关键volatile,可以说是和synchronized各领风骚,其中奥妙,我们来共同探讨下 ...

  5. Java并发编程学习笔记 深入理解volatile关键字的作用

    引言:以前只是看过介绍volatile的文章,对其的理解也只是停留在理论的层面上,由于最近在项目当中用到了关于并发方面的技术,所以下定决心深入研究一下java并发方面的知识.网上关于volatile的 ...

  6. 【java并发】(1)深入理解volatile关键字

    volatile这个关键字可能很多朋友都听说过,或许也都用过.在Java 5之前,它是一个备受争议的关键字,因为在程序中使用它往往会导致出人意料的结果.在Java 5之后,volatile关键字才得以 ...

  7. 【Java并发编程】从CPU缓存模型到JMM来理解volatile关键字

    目录 并发编程三大特性 原子性 可见性 有序性 CPU缓存模型是什么 高速缓存为何出现? 缓存一致性问题 如何解决缓存不一致 JMM内存模型是什么 JMM的规定 Java对三大特性的保证 原子性 可见 ...

  8. [C#.NET 拾遗补漏]10:理解 volatile 关键字

    要理解 C# 中的 volatile 关键字,就要先知道编译器背后的一个基本优化原理.比如对于下面这段代码: public class Example { public int x; public v ...

  9. 深入理解 volatile 关键字

    volatile 关键字是 Java 语言的高级特性,但要弄清楚其工作原理,需要先弄懂 Java 内存模型.如果你之前没了解过 Java 内存模型,那可以先看看之前我写过的一篇「深入理解 Java 内 ...

随机推荐

  1. spring in action-note-2

    1.AOP:在软件业,AOP为Aspect Oriented Programming的缩写,意为:面向切面编程,通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术.AOP是OOP的延续,是 ...

  2. Android App 侧边栏菜单的简单实现

    效果图 Layout 注意事项 想要实现侧边栏,需要配合使用DrawerLayout.因为会用到嵌套布局,所以根布局不能是 ConstraintLayout,最好使用 LinearLayout 布局. ...

  3. Centos-浏览大文件-more less

    more  less 浏览一个大文件,一屏无法显示完毕,通过这两个命令分屏读取文件内容 more 相关选项 -d 底部显示友好提示,如退出按键提示,继续浏览按键提示 -s 将多个空行减少为只有一个空行 ...

  4. Vue编写的页面部署到springboot网站项目中出现页面加载不全问题

    问题描述: 在用Vue脚手架 编写出一个页面之后, 部署到后台项目中, 因为做的是一个页面 按理来说 怎么都能够在服务器上运行 , 我也在自己的node环境测试 , 在同学的springboot上运行 ...

  5. 系统架构设计:平滑发布和ABTesting

    平滑发布的介绍 背景 单位的云办公相关系统没有成熟的平滑发布方案,导致每一次发布都是直接发布,dll文件或配置文件的变更会引起站点的重启. 云办公系统的常驻用户有10000+,即使短短半分多钟,也会收 ...

  6. Springboot集成logback,控制台日志打印两次,并且是不同的线程打印的

    背景 在搭建一个新项目的时候,从公司别的项目搞了个logback-spring.xml的配置过来,修改一下启动项目的时候发现 所有的日志都输出了两次 并且来自于不同的线程,猜测是配置重复了,但是仔细检 ...

  7. Springboot应用使用Docker部署

    首先准备好springboot应用,然后打包,我这里已经准备好了一个jar包 然后上传到服务器,准备一个目录用于存放jar包和Dokerfile文件 编写Dokerfile文件 我这里写的很简单,就简 ...

  8. ubuntu1804 snort base

    1.环境准备 apt安装 sudo apt-get update -y sudo apt-get dist-upgrade -y sudo apt-get install -y zlib1g-dev ...

  9. ansible-playbook-roles基本使用

    1. ansible-角色-roles基本使用  1.1) 创建roles目录结构 1 [root@test-1 ansible]# mkdir -p /ansible/roles/{common,n ...

  10. android中判断一个链接是否是有效的

    private boolean isValid(String urlString) { try { URL url = new URL(urlString); return URLUtil.isVal ...