spinlock一边连逻辑一边连控制器

本文来自：我爱研发网(52RD.com) - R&D大本营
详细出处：http://www.52rd.com/Blog/Archive_Thread.asp?SID=7179

spinlock的设计和实现

作者：admin
在Linux的内核中，spin lock用在多处理器环境中。当一个CPU访问一个临界资源
(critical section)的时候，需要预先取得spin lock，如果取不到的话，它就在空循环
等待，直到另外的CPU释放spin lock。由于涉及到多个处理器，spin lock的效率非常重要。
因为在等待spin lock的过程，处理器只是不停的循环检查，并不执行其他指令。但即使这样，
一般来说，spn lock的开销还是比进程调度(context switch）少得多。这就是spin lock
被广泛应用在多处理器环境的原因。

1. spin lock的数据结构

/* include/asm-i386/spinlock.h */ 

typedef struct { 

volatile unsigned int lock; 

} spinlock_t;

spin lock的数据结构很简单，只是一个整数变量lock，如果lock等于1的话，表示
这个spin lock是自由的；如果lock小于等于0的话，则表示spin lock已经被其他CPU所
获取。

2. spin lock的实现

#define spin_lock_string 

"n1:t" 

"lock ; decb %0nt" 

"js 2fn" 

".section .text.lock,"ax"n" 

"2:t" 

"cmpb $0,%0nt" 

"rep;nopnt" 

"jle 2bnt" 

"jmp 1bn" 

".previous" 

#define spin_unlock_string 

"movb $1,%0" 

:"=m" (lock->lock) : : "memory" 

static inline void spin_lock(spinlock_t *lock) 

{ 

__asm__ __volatile__( 

spin_lock_string 

:"=m" (lock->lock) : : "memory"); 

} 

static inline void spin_unlock(spinlock_t *lock) 

{ 

char oldval = 1; 

__asm__ __volatile__( 

spin_unlock_string 

); 

}

如果将上面的语句转化成纯汇编的话，则是这样：

spin_lock(lock) 

1: 

lock ; decb %0 

js 2f 

.section .text.lock, "ax" 

2: cmpb $0,%0 

rep;nop 

jle 2b 

jmp 1b 

.previous

其中%0就是函数参数传进来的lock->lock，下面详细地解释一下每一条
汇编指令：
* lock ; decb %0
decb将lock->lock减1，它前边的lock指令表示在执行decb的时候，要锁住
内存总线（memory bus），另外的CPU不能访问内存，以保证decb指令的原子性。
注意，decb并不是原子操作（atomic operation），它需要将变量从内存读出来，
放入寄存器（register），减1，再写入内存。如果在这时候另外的CPU也进行同样的操作的
时候，那么decb的执行结果就会不确定，也就是说，操作的原子性遭到了破坏。

* js 2f
如果decb的结果小于0，表示无法取得spin lock，则跳到标签为2的指令（f表示向前跳）。
如果decb的结果等于0，表示已经获得spin lock，执行下一条指令，则跳出整段代码，函数返回。
注意, "j2 2f"的下一条指令并不是"cmpb $0,%0"。

* .section .text.lock, "ax"
.previous
从.section到.previous的这一段代码被用来检测spin lock何时被释放。linux定义了一个
专门的区(.text.lock)来存放这段代码。它们和前边的"js 2f"并不在一个区（section）里，
　　　　所以说"js 2f"的下一条指令并不是"cmpb $0,%0"。
　　　　之所以定义成一个单独的区，原因是在大多数情况下，spin lock是能获取成功的，从.section
　　　　到.previous的这一段代码并不经常被调用，如果把它跟别的常用指令混在一起，会浪费指令
　　　　缓存的空间。从这里也可以看出，linux内核的实现，要时时注意效率。

* 2: cmpb $0,%0
　　rep;nop
jle 2b
jmp 1b
检查lock->lock，和0比较，如果小于等于0（jle 2b），则跳回到标签2的指令，重新比较
(b表示往回跳)。如果大于0，表示spin lock已经被释放，则往回跳回到标签1，重新试图
　　　　　取得spin lock。

　　* rep;nop
这是一条很有趣的指令:)，咋一看，这只是一条空指令，但实际上这条指令可以降低CPU的运行
　　　　频率，减低电的消耗量，但最重要的是，提高了整体的效率。因为这段指令执行太快的话，会生成
　　　　很多读取内存变量的指令，另外的一个CPU可能也要写这个内存变量，现在的CPU经常需要重新
　　　　排序指令来提高效率，如果读指令太多的话，为了保证指令之间的依赖性，CPU会以牺牲流水线
　　　　执行（pipeline）所带来的好处。从pentium 4以后，intel引进了一条pause指令，专门
　　　　用于spin lock这种情况，据intel的文档说，加上pause可以提高25倍的效率！

spin_unlock(lock)
　　* movb $1,%0
spin_unlock的实现很简单，只是重新将lock->lock置1就行了。

　　还有一个问题我想谈的是，在linux 2.3以前，spin lock是用"lock; btrl $0,%0"来实现
加锁的，但是后来的版本只使用了简单的mov指令，执行时间从22个时钟周期降低到1个时钟周期。
但是最开始linus本人不同意这种做法，因为他以为由于intel芯片的指令重排序，会使斯spin lock
的实现不稳定，但后来intel里的一个工程师出来澄清了linus的错误。这也许是open source的好处吧。

　　spin lock的实现看起来简单，但是细微之处却很复杂，如果大家需要进一步理解，请细细读一下
kernel的mail list和intel关于pentium的文档。

tielian ps:
nop指令前加rep前缀意思是：Spin-Wait and Idle Loops
p4有一个新指令pause opcode也是0f390h

spinlock一边连逻辑一边连控制器的更多相关文章

第三百零四节，Django框架，urls.py模块，views.py模块，路由映射与路由分发以及逻辑处理——url控制器
Django框架,urls.py模块,views.py模块,路由映射与路由分发以及逻辑处理——url控制器这一节主讲url控制器一.urls.py模块这个模块是配置路由映射的模块,当用户访问一个 ...
二 Django框架，urls.py模块，views.py模块，路由映射与路由分发以及逻辑处理——url控制器
Django框架,urls.py模块,views.py模块,路由映射与路由分发以及逻辑处理——url控制器这一节主讲url控制器一.urls.py模块这个模块是配置路由映射的模块,当用户访问一个 ...
十、EnterpriseFrameWork框架的分层架构及意义（控制器、业务对象、实体、Dao之间关系）
本章内容主要包括两个方面,一.是框架分层(控制器.业务对象.实体.Dao)的详细说明,二.是对比常用三层结构的区别和优势: 本文要点: 1.框架中的各个分层详细说明 2.对比常用三层结构的区别和优势 ...
iOS控制器瘦身－面向超类编程
今天写这篇文章的目的,是提供一种思路,来帮助大家解决控制器非常臃肿的问题,对控制器瘦身. 滴滴老司机要开车了如果手边有项目,不妨打开工程看一下你的控制器代码有多少行,是不是非常多?再看一下tabl ...
iOS开发 - 一个天真的搜索控制器的独白
文/Azen(简书作者)原文链接:http://www.jianshu.com/p/6d5327111511著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”. 正文一.关于横向模块开发 ...
angular.js 中的作用域数据模型控制器
1.angular.js 作为后起之秀的前端mvc框架,他于传统的前端框架都不同,我们再也不需要在html中嵌入脚本来操作对象了.它抽象出了数据模型,控制器及视图. 成功解耦了应用逻辑,数据模型,视图 ...
laravel6.0控制器-资源控制器
控制器:控制器用来处理业务的,不应该处理逻辑,如果是小项目可以把逻辑写到控制器里,大点的项目应该抽离出来业务处理层如下:services业务处理层:比如:获取值,验证值,异常捕获命名规则:控制器名:用 ...
[2018-01-12] laravel--路由(路由与控制器)
路由只用来接收请求目前我们大致了解了laravel,在开始一个Http程序需要先定义路由.之前的例子中,我们的业务逻辑都是在路由里实现的,这对于简单的网站或web应用没什么问题,当我们需要扩大规模, ...
Laravel 控制器 Controller
一.控制器存在的意义路由可以分发请求:路由中还可以引入 html 页面:我们可以在 route/web.php 中搞定一切了:但是如果把业务逻辑都写入到路由中:那路由将庞大的难以维护:于是控制器就有 ...

随机推荐

linq筛选唯一
var sizelist= (from p in stockList select p.Size).Distinct().ToArray(); newslist = newslist.OrderBy( ...
C#读取对象实例的值和对对象的属性自动赋值方法
using System; using System.Data; using System.Reflection; namespace DBUtility { /// <summary> ...
hibernate中的saveOrUpdate（）报错
最近使用hibernate保存数据的时候,没有使用id自增主键,而是使用了一种调用seq以后手动赋值的方式生成主键,然后使用saveorupdate()报错.上网查看终于知道了问题所在,记录一下: 在 ...
iOS 减法计算器
一: 在界面上拖入相应的控件二: 给每个控件设置关联 //监听按钮的点击 - (IBAction)compute:(id)sender; //第一个文本输入框的值 @property (weak, ...
【Android】Intent解读
Intent 的作用 Intent 是一个将要执行的动作的抽象的描述,一般来说是作为参数来使用,由Intent来协助完成android各个组件之间的通讯. 比如说调用startActivity()来启 ...
【Delphi】基于状态机的串口通信
通信协议串行通信接口(如RS232.RS485等)作为计算机与单片机交互数据的主要接口,广泛用于各类仪器仪表.工业监测及自动控制领域中. 通信协议是需要通信的双方所达成的一种约定,它对包括数据格式. ...
LeetCode: Minimum Depth of Binary Tree 解题报告
Minimum Depth of Binary Tree Given a binary tree, find its minimum depth. The minimum depth is the n ...
C#学习笔记（20）——使用IComparer（自己写的）
说明(2017-7-25 10:38:37): 1. 参照了上一篇百度文库里的文章. 2. 总结来看,Icomparer就是sort方法的一个参数,用来自定义一个排序规则. 3. 使用方法是,定义一个 ...
CTF之文件包含的猥琐思路
From: i春秋百度杯”CTF 一: <?php include "flag.php"; //包含flag.php这个文件 $a = @$_REQUEST['hello' ...
Grunt经常使用插件及演示样例说明
下述给出了经常使用Grunt插件,并列举了部分插件演示样例: 插件名称说明 Github地址 grunt-contrib-clean 清空文件和目录 https://github.com/grunt ...

spinlock一边连逻辑一边连控制器

spinlock一边连逻辑一边连控制器的更多相关文章

随机推荐

热门专题