futex-based pthread_cond 源代码分析
pthread_cond的实现使用了几个futex来协同进行同步,以及如何来实现的。
假定你已经明白 futex,futex-requeue,以及 pthread lowlevellock。
《linux 内核的futex - requeue 以及 requeue-pi》

pthread_cond一共使用了4个futex,其中包括1个外部的futex,是它所从属的Mutex。
pthread_cond自身包含的3个futex:
__lock:是一个lowlevellock用于pthread_cond原语操作在用户空间的临界区保护(或同步),同时保护pthread_cond的其它变量。
__futex:这是我们所熟知的条件变量阻塞队列。
__nwaiters:用作变量监视器,pthread_cond在destroy使用来同步所有没结束的wait。
这里可以看到futex除了锁之外另一种用法,用户空间可以阻塞在__nwaiters变量上,以Observer角色等待修改的一方发出更新的信号。pthread_cond_destroy会一直阻塞/唤醒监视__nwaiters,直到__nwaiters等于0为止。
pthread_cond_wait就是先后阻塞在__futex和__mutex.__lock两个futex队列进行等待,也就是futex_requeue系统调用中的futex1与futex2。pthread_cond_broadcast使用futex_requeue将__futex上的阻塞线程requeue到__mutex.__lock的等待队列上。
__total_seq 是 cond_wait调用的次序号。
__nwaiters 是 阻塞中的cond_wait的计数。
__wakeup_seq 是 发起唤醒的次序号,包括cond_signal 以及 cond_wait的timeout。
__broadcast_seq 是 cond_broadcast调用的次序号。
__woken_seq 是 cond_wait从阻塞中被唤醒的次序号。
__futex 是发起wakeup或wait的动作次序号。
规则:
__futex 在 __total_seq 和 __total_seq * 2 之间推进。__futex 为 __total_seq 和 __wakeup_seq 之和。
__total_seq 先于 __wakeup_seq 向前推进。每次wait调用使__total_seq向前推进1。后随的wakeup才能使__wakeup_seq向前推进。
__wakeup_seq 先于 __woken_seq 向前推进。wait被唤醒后将__woken_seq向前推进1,结束一次wait。
__broadcast_seq,独立的调用次序。每次broadcast,都会将__wakeup_seq,__wokenup_seq,以及__futex平衡,根据 __total_seq。
__nwaiters 未结束的 wait 调用,destroy 必须监视这个值,同步到这个值等于0才能安全进行销毁。
只有当__total_seq 不等于 __wakeup_seq 时,才能进行 signal 或 broadcast 。
当wait发现__futex这个参考次序号有变动,回到用户空间去调查情况:
1. 发现__wakeup_seq次序号有变动,即表明此时有signal调用,就可以与signal所唤醒的waiter进行竞争,竞争同步在用户空间临界区。如果__wakeup_seq != __woken_seq表明自己可以获得这次通行,如果__wakeup_seq == __woken_seq表示这次通行已经被某个waiter拔得头筹,只能决定再进内核排队。
2. 发现__broadcast_seq次序号有变动,即表明自身正包含在broadcast当中(自己修改的__total_seq,被broadcast采纳),可以不再进入内核排队,而直接获得通行。
wait都是三心两意的,一发现__futex有推进,就先打消排队的意愿,怀着被broadcast选中或幸运抢占到一次signal带来的机会,转头回到用户空间张望一下,没戏才失望地再次进入内核排队,但在排队前还是不死心。
下面来看pthread_cond_wait,pthread_cond_signal,以及pthread_cond_broadcast是如何在用户空间临界区同步的:
红色框:__lock保护的用户空间临界区。
紫色框:futex系统调用。

这里可以看到signal是全过程排他(mutual exclusion)进行的。而wait和broadcast则是用户空间和内核(系统调用)分开进行临界区同步的,它们在用户空间的代码只在用户空间的临界区同步,系统调用可以并发进行,当然也不是完全并发,在内核中系统调用的执行还是会同步进行的。换个说法,系统调用并不阻塞其它线程在用户空间在代码,一些线程阻塞在用户空间的临界区,不影响另一些线程去进行系统调用。
broadcast在唤醒线程时,是不会阻塞其它线程去调用wait的。但是signal 即使进入内核去唤醒线程时,也得阻塞其它线程去调用condvar的函数。
broadcast 与 broadcast 并发:
broadcast与broadcast同时调用,同步在用户空间临界区次序后面的broadcast,因为__total_seq == __wakeup_seq而退出,只有同步在用户临界区的第一个broadcast会继续单独执行。
signal 与 wait 和 broadcast 并发:
当signal调用时,可能有前面的wait或broadcast刚进入内核,但在signal结束之前,不允许任何用户空间的调用进入临界区。这情况下,前面的wait必须回到用户空间重新进入临界区,在signal调用完全结束之后,才能再次进入内核。
a. signal调用在broadcast执行期间,signal会因为__total_seq == __wakeup_seq而退出。
b. broadcast调用在signal执行期间,只能阻塞在用户空间临界区,等待signal调用结束。
c. signal调用时,前面已经有wait在执行,signal会将未能在内核临界区排队的wait全部延后,原理是,wait在内核临界区发现futex有变,即表明用户空间层有变动,必须先回到用户空间,延后次序再次进入内核。
d. wait调用在signal执行期间,wait只能阻塞在用户空间临界区,等待signal调用结束。
broadcast 与 wait 并发:
broadcast与wait同时调用,wait都会回到用户空间,检查自身是否包含在本次broadcast中,同步在用户空间临界区,先于broadcast的wait被包含在broadcast,后面的wait则排除在外。包含在本次broadcast中的wait则可以不用在内核排队而直接获得通行。
其它同步或锁的还有
《linux 内核的spinlock如何实现排队》
《linux 内核的各种futex功能》
《linux 内核的rt_mutex (realtime互斥体)》
《linux 内核的futex pi-support,即pi-futex使用rt_mutex委托》
futex-based pthread_cond 源代码分析的更多相关文章
- 转:RTMPDump源代码分析
0: 主要函数调用分析 rtmpdump 是一个用来处理 RTMP 流媒体的开源工具包,支持 rtmp://, rtmpt://, rtmpe://, rtmpte://, and rtmps://. ...
- 服务器程序源代码分析之三:gunicorn
服务器程序源代码分析之三:gunicorn 时间:2014-05-09 11:33:54 类别:网站架构 访问: 641 次 gunicorn是一个python web 服务部署工具,类似flup,完 ...
- LIRe 源代码分析 7:算法类[以颜色布局为例]
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LIRe 源代码分析 6:检索(ImageSearcher)[以颜色布局为例]
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LIRe 源代码分析 5:提取特征向量[以颜色布局为例]
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LIRe 源代码分析 4:建立索引(DocumentBuilder)[以颜色布局为例]
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LIRe 源代码分析 3:基本接口(ImageSearcher)
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LIRe 源代码分析 2:基本接口(DocumentBuilder)
===================================================== LIRe源代码分析系列文章列表: LIRe 源代码分析 1:整体结构 LIRe 源代码分析 ...
- LAV Filter 源代码分析 4: LAV Video (2)
上一篇文章分析了LAV Filter 中的LAV Video的两个主要的类:CLAVVideo和CDecodeThread.文章:LAV Filter 源代码分析 3: LAV Video (1) 在 ...
随机推荐
- python soket服务和客户端Demo
#服务端from socket import * s=socket(AF_INET,SOCK_STREAM)#IVP4 寻址 tcp协议 s.bind(('',6666))#补丁端口 s.listen ...
- {每日一题}:tcp协议实现简单的文件下载器(单任务版)
文件下载器客户端 这个版本的只是为了方便回顾一下TCP客服端,服务端的创建流程,缺点就是 服务器一次只能让一个人访问下载,过两个写个使用面向对象写一个多线程版的强化一下. from socket i ...
- 记录面试龙腾简合-java开发工程师经历
/** * ############ * 变强是会掉光头发的!现在的头发还是很茂盛,是该开心还是难过呢.. * ############ * / 总结下近期面试龙腾简合-java开发岗的经历.附上笔试 ...
- 从0开始独立完成企业级Java电商网站开发(服务端)
数据表结构设计 唯一索引unique,保证数据唯一性 CREATE TABLE `mmall_user` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT ...
- python购物车小案例
python购物车小案例# 案列描述:有一个小型水果店里面有水果(苹果:¥8/kg,香蕉:¥5/kg,芒果:¥15/kg,葡萄:¥12/kg),客户带了100元钱进店选购水果.# 1.客户输入相应序号 ...
- 【Maven学习笔记】mvn help:system 命令的说明
mvn help:system 命令的说明 笔者用得是windows 10 x64系统 下载了Maven3,正确配置了系统变量M2_HOME的值,并且添加到Path变量路径当中. 简单来说,Maven ...
- Android自定义控件:自适应大小的文本控件
需求 自适应大小的文本: 效果图: 项目开发中,开发人员根据UI人员提供的一套尺寸,布局了一些带文本的页面, 往往会少考虑一些数据极限的问题,造成机型屏幕适配问题. 例如: 文本(或数值)长度可变,如 ...
- Java IO编程——文件拷贝
在操作系统里面有一个copy命令,这个命令的主要功能是可以实现文件的拷贝处理,现在要求模拟这个命令,通过初始化参数输入拷贝的源文件路径与拷贝的目标路径实现文件的拷贝处理. 需求分析: ·需要实现文件的 ...
- [考试反思]0926csp-s模拟测试52:审判
也好. 该来的迟早会来. 反思再说吧. 向下跳过直到另一条分界线 %%%cbx也拿到了他的第一个AK了呢. 我的还是遥不可及. 我恨你,DeepinC. 我恨透你了.你亲手埋葬所有希望,令我无比气愤. ...
- 「刷题」GERALD07加强版
是LCT了. 首先我们不知道联通块怎么数. 然后颓标签知道了是LCT. 那么考虑一下怎么LCT搞. 有一个很普遍的思路大家也应该都知道,就是如何求一个区间中某种颜色的个数. 这个可以很简单的用主席树来 ...