还是说Memory Model，gcc的__sync_synchronize真是太坑爹了！

时间 2012-01-29 03:18:35 IT牛人博客聚合网站

原文 http://www.udpwork.com/item/6751.html

主题 GCC

嗯，还是说可见性的问题。由于CPU和编译器的乱序执行功能，我们经常不得不在代码中手动插入memory barrier。如果你还不清楚memory barrier是什么，那么请先读这个 http://en.wikipedia.org/wiki/Memory_barrier

假如你已经了解它了，那么具体怎么用呢？怎么在代码中插入一个memory barrier ? 用哪个函数？

gcc的手册中有一节叫做”Built-in functions for atomic memory access”，然后里面列举了这样一个函数：

__sync_synchronize (…)

This builtin issues a full memory barrier.

来，我们写段代码试下：

? C

int main(){

  __sync_synchronize();

  return 0;

}

然后用gcc4.2编译，

# gcc -S -c test.c

然后看对应的汇编代码，

? ASM

main:

  pushq %rbp

  movq %rsp, %rbp

  movl $0, %eax

  leave

  ret

嗯？Nothing at all !!! 不信你试一试，我的编译环境是Freebsd 9.0 release, gcc (GCC) 4.2.1 20070831 patched [FreeBSD]。

好，我换个高版本的gcc编译器试一试，gcc46 (FreeBSD Ports Collection) 4.6.3 20120113 (prerelease)

? ASM

main:

 

pushq %rbp

 

movq %rsp, %rbp

 

mfence

 

movl $0, %eax

 

popq %rbp

 

ret

看，多了一行，mfence。

怎么回事呢？这是gcc之前的一个BUG：http://gcc.gnu.org/bugzilla/show_bug.cgi?id=36793 。 2008年被发现，然后修复的。其实它之所以是一个BUG，关键在于gcc的开发者很迷惑，mfence在x86 CPU上到底有没有用？有嘛用？

那么mfence到底能不能提供我们想要的结果呢？

Intel的手册中有这么一段我一直没太读懂：

“Processors are free to fetch and cache data speculatively from regions of system memory that use the WB, WC, and WT memory types. This speculative fetching can occur at any time and is not tied to instruction execution. Thus, it is not ordered with respect to executions of the MFENCE instruction; data can be brought into the caches speculatively just before, during, or after the execution of an MFENCE instruction. Processors are free to fetch and cache data speculatively from regions of system memory that use the WB, WC, and WT memory types. This speculative fetching can occur at any time and is not tied to instruction execution. Thus, it is not ordered with respect to executions of the MFENCE instruction; data can be brought into the caches speculatively just before, during, or after the execution of an MFENCE instruction.”

但是在关于Memory Ordering的章节又说：

“Reads cannot pass earlier MFENCE instructions

Writes cannot pass earlier MFENCE instructions.

MFENCE instructions cannot pass earlier reads or writes”

综合起来的意思是，如果代码是这样，

READ A
MFENCE
READ B

那么可能会成为这样

READ A
Speculative READ B
MFENCE

但是不会成为这样

Speculative READ B
READ A
MFENCE

也就是说，Speculative READ可以穿越mfence，但是无法走的更远了，不能再穿越前面的读写的操作。所以无论如何，A、B的读取顺序还是被严格保持的。不知道我的理解对不对。

但是这些只是针对单CPU而言。多CPU（包括超线程和多核）的时候，如果还是用Locked instructions，那么没问题。否则手册里的规则没有特别提到mfence，而是说了这么一句，”Memory ordering obeys causality (memory ordering respects transitive visibility).” Causality 也是一种relaxed Model，我不是很能理解。只看到一句通俗点的解释，” If i see it and tell you about it , then you will see it too.”

这个改动对JAVA社区的影响巨大。JVM通过插入mfence指令，使得volatile变量的写入操作，能得到sequential consistency。于是Java社区现在就只有两条路，要么修改语言规范，要么把mfence换成代价更高的xchg指令。David Dice（transactional memory的TL/TL2算法的发明人）的这篇日志http://blogs.oracle.com/dave/entry/java_memory_model_concerns_on 那写的是相当的悲苦啊。

如果实在想在代码中使用membar，那么最好是认准某个编译器和某个平台。否则，非常推荐intel tbb。tbb:: atomic_fence()。

嗯，最后说下C/C++中的volatile。如果非要去咬文嚼字的看标准，那么这个关键字对于多线程同步简直一点帮助都没有。那么实际呢？我们发现很多人在C/C++中用这个关键字，而且，他们不是在写驱动，就是普通的用户态的代码。他们真的都错了吗？

看看这段神奇的代码：

http://software.intel.com/en-us/articles/single-producer-single-consumer-queue/

这段代码中，所有的membar都可以去掉，无非是告诉编译器，别乱搞。volatile关键字，在具体某个编译器中的含义，要远比ISO标准中说的要多。

这是我今天用tbb写的一个Singleton:

? CPP

class StatusCodeManager{

public:

  static StatusCodeManager& instance(){

    if( !value ) {

      StatusCodeManager* tmp = new StatusCodeManager();

      if( value.compare_and_swap(tmp,NULL)!=NULL )

        // Another thread installed the value, so throw away mine.

        delete tmp;

    }

 

    return *value;

  }

protected:

  StatusCodeManager();

private:

  static tbb::atomic<StatusCodeManager*> value;

};

虽然无锁化了，但是并不保证构造函数只执行一次。所以我一直在愁，value->init();插在哪里好呢？

（p.s. 今天找paper的时候看到一篇让我满眼冒金星的神文：《Mathematizing C++ Concurrency》 http://www.cl.cam.ac.uk/~pes20/cpp/popl085ap-sewell.pdf 第一作者是剑桥的某在读博士。）

还是说Memory Model，gcc的__sync_synchronize真是太坑爹了的更多相关文章

Java (JVM) Memory Model – Memory Management in Java
原文地址:http://www.journaldev.com/2856/java-jvm-memory-model-memory-management-in-java Understanding JV ...
memory model
最近看C++11 atomic发现对memory_order很是不理解,memory_order_relaxed/memory_order_consume/memory_order_acquire/m ...
Keil中Memory Model和Code Rom Size说明
C51中定义变量时如果省略存储器类型,Keil C51编译系统则会按编译模式SMALL.COMPACT和LARGE所规定的默认存储器类型去指定变量的存储区域,无论什么存储模式都可以声明变量在任何的80 ...
当我们在谈论JMM（Java memory model）的时候，我们在谈论些什么
前面几篇中,我们谈论了synchronized.final以及voilate的用法和底层实现,都绕不开一个话题-Java内存模型(java memory model,简称JMM).Java内存模型是保 ...
【翻译】go memory model
https://studygolang.com/articles/819 原文链接 Introduction The Go memory model specifies the conditions ...
并发研究之Java内存模型（Java Memory Model)
Java内存模型JMM java内存模型定义上一遍文章我们讲到了CPU缓存一致性以及内存屏障问题.那么Java作为一个跨平台的语言,它的实现要面对不同的底层硬件系统,设计一个中间层模型来屏蔽底层的硬 ...
java学习：JMM(java memory model)、volatile、synchronized、AtomicXXX理解
一.JMM(java memory model)内存模型从网上淘来二张图: 上面这张图说的是,在多核CPU的系统中,每个核CPU自带高速缓存,然后计算机主板上也有一块内存-称为主内(即:内存条).工 ...
CUDA ---- Memory Model
Memory kernel性能高低是不能单纯的从warp的执行上来解释的.比如之前博文涉及到的,将block的维度设置为warp大小的一半会导致load efficiency降低,这个问题无法用war ...
11 The Go Memory Model go语言内置模型
The Go Memory Model go语言内置模型 Version of May 31, 2014 Introduction 介绍 Advice 建议 Happens Before 在发生之前 ...

随机推荐

SymPy库常用函数
简介 SymPy是一个符号计算的Python库.它的目标是成为一个全功能的计算机代数系统,同时保持代码简洁.易于理解和扩展.它完全由Python写成,不依赖于外部库.SymPy支持符号计算.高精度计 ...
Web Design：给实验室UI们的一堂课（上）
实验室的UI越来越水,设计什么的做的一塌糊涂,所以拖了很久,就想给他们讲一下设计或者说入门吧,上周末才倒出来时间. 这里放上PPT和讲稿吧,懒得去整理板式了. 主要讲了一下Web Design怎么做, ...
SQL语句中各种数据类型转换方法总结
1.Access 每个函数都可以强制将一个表达式转换成某种特定数据类型. 语法 CBool(expression) CByte(expression) CCur(expression) CDate(e ...
SQL1092N The requested command or operation failed because the user ID does not have the authority to perform the requested command or operation.
1.前一天安装号db2后,做了如下处理: ************************************************************ 修改 /etc/sudoers 文件 ...
ES6 入门系列 - 函数的扩展
1函数参数的默认值基本用法在ES6之前,不能直接为函数的参数指定默认值,只能采用变通的方法. function log(x, y) { y = y || 'World'; console.log( ...
ORACLE-12C-RAC INSTALL
OS: Oracle Linux Server release 5.7 DB: 12.1.0.1.0 挂载镜像:mkdir /media/diskmount /dev/cdrom /media/dis ...
MySQL使用rand函数实现随机数[转]
如何写一个语句能一下更新几百条MYSQL数据! 需要测试MYSQL数据库,里面有一个上万条数据的数据库,如何写一个PHP文件一下每次更新几百条信息,我都是写一个循环一次更新一条信息,这样我知道用WHI ...
MVC4.0 利用IActionFilter实现简单的后台操作日志功能
首先我们要了解MVC提供了4种常用的拦截器:IActionFilter(Action拦截器接口).IExceptionFilter(异常拦截器接口).IResultFilter(Result拦截器接口 ...
[转]Reed Solomon纠删码
[转]Reed Solomon纠删码 http://peterylh.blog.163.com/blog/static/12033201371375050233/ 纠删码是存储领域常用的 ...
SharePoint 2010 中使用Ztree和EasyUI样式冲突问题
<style type="text/css"> /*解决ztree和SharePoint样式冲突问题*/ .ztree li a { display: inline-b ...

还是说Memory Model，gcc的__sync_synchronize真是太坑爹了

还是说Memory Model，gcc的__sync_synchronize真是太坑爹了！

还是说Memory Model，gcc的__sync_synchronize真是太坑爹了的更多相关文章

随机推荐

热门专题