pthread_cond的实现使用了几个futex来协同进行同步,以及如何来实现的。

假定你已经明白 futex,futex-requeue,以及 pthread lowlevellock。

linux 内核的futex

linux 内核的futex - requeue 以及 requeue-pi

pthread的lowlevellock

pthread_cond一共使用了4个futex,其中包括1个外部的futex,是它所从属的Mutex。

pthread_cond自身包含的3个futex:

__lock:是一个lowlevellock用于pthread_cond原语操作在用户空间的临界区保护(或同步),同时保护pthread_cond的其它变量。

__futex:这是我们所熟知的条件变量阻塞队列。

__nwaiters:用作变量监视器,pthread_cond在destroy使用来同步所有没结束的wait。

这里可以看到futex除了锁之外另一种用法,用户空间可以阻塞在__nwaiters变量上,以Observer角色等待修改的一方发出更新的信号。pthread_cond_destroy会一直阻塞/唤醒监视__nwaiters,直到__nwaiters等于0为止。

pthread_cond_wait就是先后阻塞在__futex和__mutex.__lock两个futex队列进行等待,也就是futex_requeue系统调用中的futex1与futex2。pthread_cond_broadcast使用futex_requeue将__futex上的阻塞线程requeue到__mutex.__lock的等待队列上。

__total_seq 是 cond_wait调用的次序号。
__nwaiters 是 阻塞中的cond_wait的计数。
__wakeup_seq 是 发起唤醒的次序号,包括cond_signal 以及 cond_wait的timeout。
__broadcast_seq 是 cond_broadcast调用的次序号。
__woken_seq 是 cond_wait从阻塞中被唤醒的次序号。
__futex 是发起wakeup或wait的动作次序号。

规则:

__futex 在 __total_seq 和 __total_seq * 2 之间推进。__futex 为 __total_seq 和 __wakeup_seq 之和。

__total_seq 先于 __wakeup_seq 向前推进。每次wait调用使__total_seq向前推进1。后随的wakeup才能使__wakeup_seq向前推进。

__wakeup_seq 先于 __woken_seq 向前推进。wait被唤醒后将__woken_seq向前推进1,结束一次wait。

__broadcast_seq,独立的调用次序。每次broadcast,都会将__wakeup_seq,__wokenup_seq,以及__futex平衡,根据 __total_seq。

__nwaiters 未结束的 wait 调用,destroy 必须监视这个值,同步到这个值等于0才能安全进行销毁。

只有当__total_seq 不等于 __wakeup_seq 时,才能进行 signal 或 broadcast 。

当wait发现__futex这个参考次序号有变动,回到用户空间去调查情况:

1. 发现__wakeup_seq次序号有变动,即表明此时有signal调用,就可以与signal所唤醒的waiter进行竞争,竞争同步在用户空间临界区。如果__wakeup_seq != __woken_seq表明自己可以获得这次通行,如果__wakeup_seq == __woken_seq表示这次通行已经被某个waiter拔得头筹,只能决定再进内核排队。
2. 发现__broadcast_seq次序号有变动,即表明自身正包含在broadcast当中(自己修改的__total_seq,被broadcast采纳),可以不再进入内核排队,而直接获得通行。

wait都是三心两意的,一发现__futex有推进,就先打消排队的意愿,怀着被broadcast选中或幸运抢占到一次signal带来的机会,转头回到用户空间张望一下,没戏才失望地再次进入内核排队,但在排队前还是不死心。

下面来看pthread_cond_wait,pthread_cond_signal,以及pthread_cond_broadcast是如何在用户空间临界区同步的:

红色框:__lock保护的用户空间临界区。

紫色框:futex系统调用。

这里可以看到signal是全过程排他(mutual exclusion)进行的。而wait和broadcast则是用户空间和内核(系统调用)分开进行临界区同步的,它们在用户空间的代码只在用户空间的临界区同步,系统调用可以并发进行,当然也不是完全并发,在内核中系统调用的执行还是会同步进行的。换个说法,系统调用并不阻塞其它线程在用户空间在代码,一些线程阻塞在用户空间的临界区,不影响另一些线程去进行系统调用。

broadcast在唤醒线程时,是不会阻塞其它线程去调用wait的。但是signal 即使进入内核去唤醒线程时,也得阻塞其它线程去调用condvar的函数。

broadcast 与 broadcast 并发:

broadcast与broadcast同时调用,同步在用户空间临界区次序后面的broadcast,因为__total_seq == __wakeup_seq而退出,只有同步在用户临界区的第一个broadcast会继续单独执行。

signal 与 wait 和 broadcast 并发:

当signal调用时,可能有前面的wait或broadcast刚进入内核,但在signal结束之前,不允许任何用户空间的调用进入临界区。这情况下,前面的wait必须回到用户空间重新进入临界区,在signal调用完全结束之后,才能再次进入内核。

a. signal调用在broadcast执行期间,signal会因为__total_seq == __wakeup_seq而退出。
b. broadcast调用在signal执行期间,只能阻塞在用户空间临界区,等待signal调用结束。
c. signal调用时,前面已经有wait在执行,signal会将未能在内核临界区排队的wait全部延后,原理是,wait在内核临界区发现futex有变,即表明用户空间层有变动,必须先回到用户空间,延后次序再次进入内核。
d. wait调用在signal执行期间,wait只能阻塞在用户空间临界区,等待signal调用结束。

broadcast 与 wait 并发:

broadcast与wait同时调用,wait都会回到用户空间,检查自身是否包含在本次broadcast中,同步在用户空间临界区,先于broadcast的wait被包含在broadcast,后面的wait则排除在外。包含在本次broadcast中的wait则可以不用在内核排队而直接获得通行。

其它同步或锁的还有

linux 内核的spinlock如何实现排队》

linux 内核的另一个自旋锁 - 读写锁

linux 内核的各种futex功能》

linux 内核的rt_mutex (realtime互斥体)

linux 内核的futex pi-support,即pi-futex使用rt_mutex委托

linux 内核的rt_mutex 锁操作实现的临界区

phtread_mutex 组合

ACE框架 同步原语设计

futex-based pthread_cond的更多相关文章

  1. linux 内核的futex

    futex是linux内核为用户空间实现锁等同步机制而设计的同步排队(队列queueing)服务.在futex.c的注释中,futex起源于"Fast Userspace Mutex&quo ...

  2. linux 内核的futex - requeue 以及 requeue-pi

    futex为更好支持pthread_cond的实现(,最主要是broadcast),设计了requeue功能,并以futex系统调用提供操作接口,包括一对配对的操作 futex_wait_requeu ...

  3. futex-based pthread_cond 源代码分析

    pthread_cond的实现使用了几个futex来协同进行同步,以及如何来实现的. 假定你已经明白 futex,futex-requeue,以及 pthread lowlevellock. < ...

  4. Distributed MVCC based cross-row transaction

    The algorithm for supporting distributed MVCC based cross-row transactions on top of a distributed k ...

  5. Plant Design Review Based on AnyCAD

    Plant Design Review Based on AnyCAD eryar@163.com Abstract. AVEVA Review is used to 3D model visuali ...

  6. CQRS, Task Based UIs, Event Sourcing agh!

    原文地址:CQRS, Task Based UIs, Event Sourcing agh! Many people have been getting confused over what CQRS ...

  7. Prototype based langue LUA

    Prototype-based programming https://en.wikipedia.org/wiki/Prototype-based_programming Prototype-base ...

  8. 原创: How to build a query based on Definition Updates installed

    In SCCM 2012 R2, you can use following class. Use SMS_CombinedDeviceResources.EPAntivirusSignatureLa ...

  9. Spike Notes on Lock based Concurrency Concepts

    Motivation 承并发编程笔记Outline,这篇文章专注于记录学习基于锁的并发概念的过程中出现的一些知识点,为并发高层抽象做必要的准备. 尽管存在Doug Lee开山之作Concurrent ...

随机推荐

  1. 【子非鱼】归并排序过程呈现之java内置GUI表示

    在网上看到一个视频将各种排序用视频表示出来,配上音乐,挺好玩的样子,就算是不会编程的人看到也会觉得很舒服,碰巧我也正在写归并算法,于是就用java的GUI实现一个. 归并排序的时间复杂度是T(n)=O ...

  2. ECMAScript6-解构

    ▓▓▓▓▓▓ 大致介绍 解构:就是将声明的一组变量和与相同结构的数组或者对象的元素数值一一对应,并将变量相对应元素进行赋值 ▓▓▓▓▓▓ 数组解构 例子: let [a,b,c] = [1,2,3]; ...

  3. 一步步教你使用rem适配不同屏幕的移动设备

    1.先说说几个前端常用的几个单位的概论: 1.px (pixel,像素):是一个虚拟长度单位,是计算机系统的数字化图像长度单位,如果px要换算成物理长度,需要指定精度DPI(Dots Per Inch ...

  4. 光环国际PRINCE2培训费是多少?

    光环国际学习PRINCE2新活动 第一重好礼:获得商务背包一个 第二重好礼:获得600元学习代金券一张 第三重好礼:获得高清流程图一张 活动时间:2017年3月20日-3月31日 PRINCE2 (P ...

  5. 【转】flash air中读取本地文件的三种方法

    actionscript中读取本地文件操作有两种代码如下 1.使用File和FileStream两个类,FileStream负责读取数据的所以操作:(同步操作) var stream:FileStre ...

  6. 性能测试分享:jmeter性能监控(一)

    性能测试分享:jmeter性能监控(一) poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.如果对课程感兴趣,请大家咨询qq:908 ...

  7. Android敏感词过滤主要类

    package com.tradeaider.app.utils; import com.tradeaider.app.activity.MyApplication;import java.util. ...

  8. Java并发编程:线程控制

    在上一篇文章中(Java并发编程:线程的基本状态)我们介绍了线程状态的 5 种基本状态以及线程的声明周期.这篇文章将深入讲解Java如何对线程进行状态控制,比如:如何将一个线程从一个状态转到另一个状态 ...

  9. WSDL/WebService/SOAP/REST/AXIS/CXF 开放式服务

    WebService是一种数据交换标准.通过WebService标准,你可以把项目中的方法作为接口提供给其他项目使用. 有时候我们习惯性地将具体提供服务的某个方法称为WebService.比如图书系统 ...

  10. UIDatePicker的使用

    UIDatePicker的介绍 UIDatePicker这个类的对象让用户可以在多个车轮上选择日期和时间.iPhone手机上的‘时钟’应用程序中的时间与闹铃中便使用了该控件.使用这个控件时,如果你能配 ...