Linux Kernel CMPXCHG函数分析

原文地址：http://blog.csdn.net/penngrove/article/details/44175387

最近看到Linux Kernel cmpxchg的代码，对实现很不理解。上网查了内嵌汇编以及Intel开发文档，才慢慢理解了，记录下来以享和我一样困惑的开发者。其实cmpxchg实现的原子操作原理早已被熟知：

cmpxchg(void* ptr, int old, int new)，如果ptr和old的值一样，则把new写到ptr内存，否则返回ptr的值，整个操作是原子的。在Intel平台下，会用lock cmpxchg来实现，这里的lock个人理解是锁住内存总线，这样如果有另一个线程想访问ptr的内存，就会被block住。

好了，让我们来看Linux Kernel中的cmpxchg(网上找来的，我自己机器上没找到对应的头文件，据说在include/asm-i386/cmpxchg.h)实现：

01./* TODO: You should use modern GCC atomic instruction builtins instead of this. */

02.#include <stdint.h>

03.#define cmpxchg( ptr, _old, _new ) { \

04.  volatile uint32_t *__ptr = (volatile uint32_t *)(ptr);   \

05.  uint32_t __ret;                                     \

06.  asm volatile( "lock; cmpxchgl %2,%1"           \

07.    : "=a" (__ret), "+m" (*__ptr)                \

08.    : "r" (_new), "0" (_old)                     \

09.    : "memory");                 \

10.  );                                             \

11.  __ret;                                         \

12.}

/* TODO: You should use modern GCC atomic instruction builtins instead of this. */

#include <stdint.h>

#define cmpxchg( ptr, _old, _new ) { \

  volatile uint32_t *__ptr = (volatile uint32_t *)(ptr);   \

  uint32_t __ret;                                     \

  asm volatile( "lock; cmpxchgl %2,%1"           \

    : "=a" (__ret), "+m" (*__ptr)                \

    : "r" (_new), "0" (_old)                     \

    : "memory");				 \

  );                                             \

  __ret;                                         \

}

主要要看懂内嵌汇编，c的内嵌汇编格式是

01.asm ( assembler template

02.    : output operands                   (optional)

03.    : input operands                    (optional)

04.    : clobbered registers list          (optional)

05.    );

asm ( assembler template

    : output operands                   (optional)

    : input operands                    (optional)

    : clobbered registers list          (optional)

    );

output operands和inpupt operands指定参数，它们从左到右依次排列，用','分割，编号从0开始。以cmpxchg汇编为例，(__ret)对应0，(*__ptr)对应1，(_new)对应2，(_old)对应3，如果在汇编中用到"%2"，那么就是指代_new，"%1"指代(*__ptr)。

"=a"是说要把结果写到__ret中，而且要使用eax寄存器，所以最后写结果的时候是的操作是mov eax, ret (eax==>__ret)。"r" (_new)是要把_new的值读到一个通用寄存器中使用。

在cmpxchg中，注意"0"(_old)，这个是困惑我的地方，它像告诉你(_old)和第0号操作数使用相同的寄存器或者内存，即(_old)的存储在和0号操作数一样的地方。在cmpxchg中，就是说_old和__ret使用一样的寄存器，而__ret使用的寄存器是eax，所以_old也用eax。

明白了这些，再来看cmpxchgl，在Intel开发文档上说：

0F B1/r        CMPXCHG r/m32, r32           MR Valid Valid*          Compare EAX with r/m32. If equal, ZF is set
                                                                                                     and r32 is loaded into r/m32. Else, clear ZF
                                                                                                     and load r/m32 into EAX.

翻译一下：

比较eax和目的操作数(第一个操作数)的值，如果相同，ZF标志被设置，同时源操作数(第二个操作)的值被写到目的操作数，否则，清ZF标志，并且把目的操作数的值写回eax。

好了，把上面这句话套在cmpxchg上就是：

比较_old和(*__ptr)的值，如果相同，ZF标志被设置，同时_new的值被写到(*__ptr)，否则，清ZF标志，并且把(*__ptr)的值写回_old。

很明显，符合我们对cmpxchg的理解。

另：Intel开发手册上说lock就是让CPU排他地使用内存。

Linux Kernel CMPXCHG函数分析的更多相关文章

Linux kernel workqueue机制分析
Linux kernel workqueue机制分析在内核编程中,workqueue机制是最常用的异步处理方式.本文主要基于linux kernel 3.10.108的workqueue文档分析其基 ...
Linux Kernel‘ieee80211_radiotap_iterator_init()’函数拒绝服务漏洞
漏洞名称: Linux Kernel‘ieee80211_radiotap_iterator_init()’函数拒绝服务漏洞 CNNVD编号: CNNVD-201312-041 发布时间: 2013- ...
Linux kernel ‘qeth_snmp_command’函数缓冲区溢出漏洞
漏洞名称: Linux kernel ‘qeth_snmp_command’函数缓冲区溢出漏洞 CNNVD编号: CNNVD-201311-423 发布时间: 2013-11-29 更新时间: 201 ...
Linux kernel ‘aac_send_raw_srb’函数输入验证漏洞
漏洞名称: Linux kernel ‘aac_send_raw_srb’函数输入验证漏洞 CNNVD编号: CNNVD-201311-422 发布时间: 2013-11-29 更新时间: 2013- ...
Linux kernel ‘lbs_debugfs_write’函数数字错误漏洞
漏洞名称: Linux kernel ‘lbs_debugfs_write’函数数字错误漏洞 CNNVD编号: CNNVD-201311-421 发布时间: 2013-11-29 更新时间: 2013 ...
Linux kernel ‘xfs_attrlist_by_handle()’函数缓冲区溢出漏洞
漏洞名称: Linux kernel ‘xfs_attrlist_by_handle()’函数缓冲区溢出漏洞 CNNVD编号: CNNVD-201311-392 发布时间: 2013-11-29 更新 ...
Linux kernel ‘uio_mmap_physical’函数缓冲区溢出漏洞
漏洞名称: Linux kernel ‘uio_mmap_physical’函数缓冲区溢出漏洞 CNNVD编号: CNNVD-201311-154 发布时间: 2013-11-13 更新时间: 201 ...
Linux Kernel ‘write_tag_3_packet()’函数本地基于堆的缓冲区溢出漏洞
漏洞名称: Linux Kernel ‘write_tag_3_packet()’函数本地基于堆的缓冲区溢出漏洞 CNNVD编号: CNNVD-201311-067 发布时间: 2013-11-07 ...
Linux Kernel ‘exitcode_proc_write()’函数本地缓冲区溢出漏洞
漏洞名称: Linux Kernel ‘exitcode_proc_write()’函数本地缓冲区溢出漏洞 CNNVD编号: CNNVD-201311-061 发布时间: 2013-11-07 更新时 ...

随机推荐

使用NPOI和线程池快速加载EXCEL数据
private void FilterData() { List<Task> tasks = new List<Task>(); IWorkbook workbook = Cs ...
客户端发包 GS端接收
客户端发包,GS接收 bool GameServer::ProcessLoop(packet& rPkt)//GS线程做的 { if(false == m_spDataLayer->Re ...
UML状态图（转载）
概述: 图表本身的名称,阐明该图的目的和其他细节.它描述了在一个系统中的一个组成部分不同的状态.状态是特定的一个系统的组件/对象. 状态图描述了一个状态机.我们阐明的状态机可以被定义为一台机器,它定义 ...
Sqli-labs less 40
Less-40 本关的sql语句为SELECT * FROM users WHERE id=('$id') LIMIT 0,1 我们根据sql语句构造以下的payload: http://127.0. ...
tomcat 常见错误
1.启动时加载会话错误 Exception loading sessions from persistent storage 处理方法:删除tomcat对应的项目目录下 work/session.se ...
EF 中更新模型的问题，这种错误（因为相同类型的其他实体已具有相同的主键值。）
在EF经常在更新模型的时候可能会同时操作一个实体几次. 其实除了SaveChanges外,其它的几次基本都是要查询出一个结果, 例如更新的时候,我们要查一下这个表中有没有相同的纪录之类的. 查询完之后 ...
【剑指offer】从尾到头打印链表
我的思路:先翻转链表,再打印. 网上思路:利用栈的后进先出性质:或者用递归,本质也是栈. 我的代码: #include <vector> using namespace std; stru ...
使用Visio进行UML建模
http://www.qdgw.edu.cn/zhuantiweb/jpkc/2009/rjkf/xmwd/Visio_UmlModel.htm#_Toc80417837 内容提纲: 1.VISIO中 ...
JMeter监控服务器CPU, 内存,网络数据
http://wenku.baidu.com/link?url=un5QtWHa-A9kCTeVN0PnU3gDEMri38hYqjc8-skNXTD-v65FMObdq1LxfQDb1I6oIK9k ...
【poj1006-biorhythms】中国剩余定理
http://poj.org/problem?id=1006 题意:中国剩余定理的裸题. 题目可转化为求最小的x满足以下条件: x%23=a;x%28=b;x%33=c; 关于中国剩余定理可看我昨天的 ...

Linux Kernel CMPXCHG函数分析

Linux Kernel CMPXCHG函数分析的更多相关文章

随机推荐

热门专题