C++ 内存模型 write_x_read

之前一段时间偶然在 B 站上刷到了南京大学蒋炎岩（jyy）老师在直播操作系统网课。点进直播间看了一下发现这个老师实力非凡，上课从不照本宣科，而且旁征博引又不吝于亲自动手演示，于是点了关注。后来开始看其网课录播，其中一节的标题吸引了我，多处理器编程：从入门到放弃 (线程库；现代处理器和宽松内存模型)。“多处理器编程”这个词让我联想到去年看的《The Art of Multiprocessor Programming》，于是仔细看了一下这节网课。里面介绍到了一个试例 write_x_read_y，它是用 C 语言和内联汇编写的，它用来说明运行期指令重排。这个试例能够成功观测到运行期指令重排现象。这让我不得不佩服 jyy 的实践精神。之前看了一些介绍 C++ 内存模型的文章，没有一个能用可复现的完整代码说明问题的，全部都是说这段代码可能出现 xx 结果，没有实际的执行结果。在 C++ 内存模型中，这个测试用例除了能够说明运行期指令重排，也能用于说明 happens-before consistency 和 sequential consistency 的差别。于是尝试用 C++ Atomic 来实现这段代码，看看能不能观测到预期结果。

首先线程库 pthread 替换为 std::thread，内联汇编替换为 std::atomic，且 load 和 store 操作全部使用最弱的 std::memory_order_relaxed 内存序。完整的代码如下：

// write_x_read_y.cpp

#include <atomic>

#include <thread>

#include <stdio.h>

static std::atomic_int flag{0};

inline void wait_flag(int id)

{

    while (!(flag & (0x1 << id))) {}

}

inline void clear_flag(int id)

{

    flag.fetch_and(~(0x1 << id));

}

std::atomic_int x{0}, y{0};

void write_x_read_y()

{

    while (true) {

        wait_flag(0);

        x.store(1, std::memory_order_relaxed);    // t1.1

        int v = y.load(std::memory_order_relaxed); // t1.2

        printf("%d ", v);

        clear_flag(0);

    }

}

void write_y_read_x()

{

    while (true) {

        wait_flag(1);

        y.store(1, std::memory_order_relaxed);    // t2.1

        int v = x.load(std::memory_order_relaxed); // t2.2

        printf("%d ", v);

        clear_flag(1);

    }

}

int main()

{

    std::thread t1(write_x_read_y), t2(write_y_read_x);

    while (true) {

        x = 0, y = 0;

        flag = 0b11;

        while (flag) {}

        printf("\n");

        fflush(stdout);

    }

    t1.join();

    t2.join();

}

注意这段代码要开启代码优化才能观测到运行期指令重排，这里选择 O2

g++ -o write_x_read_y.out -O2 -pthread -std=c++11 -Wall -Wextra write_x_read_y.cpp

然后使用 jyy 视频里使用的 Unix 命令进行测试并整理结果

./write_x_read_y.out | head -n1000000 | sort | uniq -c

以下结果是在虚拟机环境中执行得到的。宿主机 CPU 型号为 AMD Ryzen 7 5800X，OS 为 Windows 10 x64，虚拟机是 Rocky Linux 8.6。

成功观测到“0 0”。假设程序按照简单交叉执行，执行结果只可能是“0 1”、“1 0”、“1 1”这三种，不可能出现“0 0”。也就是说发生了运行期指令重排。

接下来，将 std::memory_order_relaxed 替换为 std::memory_order_release 和 std::memory_order_acquire，再测一遍

x.store(1, std::memory_order_release);    // t1.1

int v = y.load(std::memory_order_acquire); // t1.2

printf("%d ", v);

y.store(1, std::memory_order_release);    // t2.1

int v = x.load(std::memory_order_acquire); // t2.2

printf("%d ", v);

测试结果为：

又出现了“0 0”，也就说明这个试例无法区分 relaxed memory model 和 happens-before consistency。这也与理论相符，虽然 t1.1 happens-before t2.2、t2.1 happens-before t1.2，但是却无法借此推导出约束关系来限制执行结果。“0 0”依然有可能出现。

接下来替换为 std::memory_order_seq_cst

x.store(1, std::memory_order_seq_cst);    // t1.1

int v = y.load(std::memory_order_seq_cst); // t1.2

printf("%d ", v);

y.store(1, std::memory_order_seq_cst);    // t2.1

int v = x.load(std::memory_order_seq_cst); // t2.2

printf("%d ", v);

测试结果为：

这次“0 0”并没有出现，运行期指令重排没有被观测到。这与理论相符，使用 std::memory_order_seq_cst 的所有原子操作可以视为简单交叉执行，也就是 sequential consistency。“0 0”不可能出现。

write_x_read_y 这个试例很好地说明了 C++ 内存模型中的 happens-before consistency 和 sequential consistency 的区别。它的代码片段常见于各种相关文章中，却没有完整的代码和实际的测试结果。这下也算补全了 C++ 内存模型知识的一块拼图。

C++ 内存模型 write_x_read_y 试例构造的更多相关文章

并发编程之 Java 内存模型 + volatile 关键字 + Happen-Before 规则
前言楼主这个标题其实有一种作死的味道,为什么呢,这三个东西其实可以分开为三篇文章来写,但是,楼主认为这三个东西又都是高度相关的,应当在一个知识点中.在一次学习中去理解这些东西.才能更好的理解 Jav ...
java内存模型及分块
转自:http://www.cnblogs.com/BangQ/p/4045954.html 1.JMM简介 2.堆和栈 3.本机内存 4.防止内存泄漏 1.JMM简介 i.内存模型概述 Ja ...
Inside JVM 内存模型
Inside JVM 内存模型来源原文:https://blog.csdn.net/silentbalanceyh/article/details/4661230 参考:IBM开发中心文档,&l ...
Java内存模型（转载）
本文章节: 1.JMM简介 2.堆和栈 3.本机内存 4.防止内存泄漏 1.JMM简介 i.内存模型概述 Java平台自动集成了线程以及多处理器技术,这种集成程度比Java以前诞生的计算机语言要厉害很 ...
JVM内存模型三
本文章节: 1.JMM简介 2.堆和栈 3.本机内存 4.防止内存泄漏 1.JMM简介 i.内存模型概述 Java平台自动集成了线程以及多处理器技术,这种集成程度比Java以前诞生的计算机语言要厉 ...
第三章 - CPU缓存结构和java内存模型
CPU 缓存结构原理 CPU 缓存结构查看 cpu 缓存速度比较查看 cpu 缓存行 cpu 拿到的内存地址格式是这样的 CPU 缓存读根据低位,计算在缓存中的索引判断是否有效 0 去内存读 ...
Java内存模型深度解析：final--转
原文地址:http://www.codeceo.com/article/java-memory-6.html 与前面介绍的锁和Volatile相比较,对final域的读和写更像是普通的变量访问.对于f ...
【JVM】JVM系列之内存模型（六）
一.前言经过前面的学习,我们终于进入了虚拟机最后一部分的学习,内存模型.理解内存模型对我们理解虚拟机.正确使用多线程编程提供很大帮助.下面开始正式学习. 二.Java并发基础在并发编程中存在两个关 ...
JVM内存模型、指令重排、内存屏障概念解析
在高并发模型中,无是面对物理机SMP系统模型,还是面对像JVM的虚拟机多线程并发内存模型,指令重排(编译器.运行时)和内存屏障都是非常重要的概念,因此,搞清楚这些概念和原理很重要.否则,你很难搞清楚哪 ...

随机推荐

将CSV格式或者EXCEL格式的文件导入到HIVE数据仓库中
学习内容:数据导入,要求将CSV格式或者EXCEL格式的文件导入到HIVE数据仓库中: ①hive建表:test1 create table test1 (InvoiceNo String, Stoc ...
SpringBoot 整合 RabbitMQ 实现消息可靠传输
消息的可靠传输是面试必问的问题之一,保证消息的可靠传输主要在生产端开启 comfirm 模式,RabbitMQ 开启持久化,消费端关闭自动 ack 模式. 环境配置 SpringBoot 整合 Rab ...
goose消元
ps.改了标题魔板思路:按序消除变量,用当前行(i)[行i消\(x_i\)元素],消后面的每一行的i元素最后按逆序回代值注意若有i~n行i元素系数都为0说明没有唯一解(其余x的解跟i元素有关) ...
vs2022+resharper C++ = 拥有一个不输clion的代码体验
这篇文章详细讲一下resharper C++在vs2022中的配置,让他拥有跟clion一样好用的代码补全功能. 为什么clion写代码体验很好好用为啥还要用vs呢,因为网上很多教程都是基于visua ...
Vue出现Component template should ...
当运行vue出现错误Component template should contain exactly one root element. If you ...的时候,我们只需要将<templa ...
Kubernetes Job Controller 原理和源码分析（二）
概述程序入口Job controller 的创建Controller 对象NewController()podControlEventHandlerJob AddFunc DeleteFuncJob ...
【Java面试】什么是可重入，什么是可重入锁? 它用来解决什么问题?
一个工作了3年的粉丝,去一个互联网公司面试,结果被面试官怼了. 面试官说:"这么简单的问题你都不知道? 没法聊了,回去等通知吧". 这个问题是: "什么是可重入锁,以及它 ...
2021.03.13【NOIP提高A&B组】模拟总结
T1 题目大意:从原点开始循环执行命令,问最后的位置好吧这就是一道幼儿园的周期问题,模拟即可 #include<bits/stdc++.h> using namespace std; c ...
二、shell 脚本条件测试
目录一.条件测试 test 格式文件测试文件测试常见选项整数值比较字符串比较浮点数的运算逻辑测试二.if语句 1单分支 2双分支结构 3多分支结构三元运算符三.case 一.条件测 ...
实现领域驱动设计 - 使用ABP框架 - 创建实体
用例演示 - 创建实体本节将演示一些示例用例并讨论可选场景. 创建实体从实体/聚合根类创建对象是实体生命周期的第一步.聚合/聚合根规则和最佳实践部分建议为Entity类创建一个主构造函数,以保证创 ...

C++ 内存模型 write_x_read_y 试例构造

C++ 内存模型 write_x_read_y 试例构造的更多相关文章

随机推荐

热门专题