一次 .NET Core 中玩锁的经历：ManualResetEventSlim, Semaphore 与 SemaphoreSlim

最近同事对 .net core memcached 缓存客户端 EnyimMemcachedCore 进行了高并发下的压力测试，发现在 linux 上高并发下使用 async 异步方法读取缓存数据会出现大量失败的情况，比如在一次测试中，100万次读取缓存，只有12次成功，999988次失败，好恐怖。如果改为同步方法，没有一次失败，100%成功。奇怪的是，同样的压力测试程序在 Windows 上异步读取却没问题，100%成功。

排查后发现是2个地方使用的锁引起的，一个是 ManualResetEventSlim ，一个是 Semaphore ，这2个锁是在同步方法中使用的，但 aync 异步方法中调用了这2个同步方法，我们来分别看一下。

使用 ManualResetEventSlim 是在创建 Socket 连接时用于控制连接超时

var args = new SocketAsyncEventArgs();

using (var mres = new ManualResetEventSlim())

{

    args.Completed += (s, e) => mres.Set();

    if (socket.ConnectAsync(args))

    {

        if (!mres.Wait(timeout))

        {

            throw new TimeoutException("Could not connect to " + endpoint);

        }

    }

}

使用 Semaphore 是在从 EnyimMemcachedCore 自己实现的 Socket 连接池获取 Socket 连接时

if (!this.semaphore.WaitOne(this.queueTimeout))

{

    message = "Pool is full, timeouting. " + _endPoint;

    if (_isDebugEnabled) _logger.LogDebug(message);

    result.Fail(message, new TimeoutException());

    // everyone is so busy

    return result;

}

为了弃用这个2个锁造成的异步并发问题，采取了下面2个改进措施：

1）对于 ManualResetEventSlim ，参考 corefx 中 SqlClient 的 SNITcpHandle 的实现，改用 CancellationTokenSource 控制连接超时

var cts = new CancellationTokenSource();

cts.CancelAfter(timeout);

void Cancel()

{

    if (!socket.Connected)

    {

        socket.Dispose();

    }

}

cts.Token.Register(Cancel);

socket.Connect(endpoint);

if (socket.Connected)

{

    connected = true;

}

else

{

    socket.Dispose();

}

2）对于 Semaphore ，根据同事提交的 PR ，将 Semaphore 换成 SemaphoreSlim ，用 SemaphoreSlim.WaitAsync 方法等待信号量锁

if (!await this.semaphore.WaitAsync(this.queueTimeout))

{

    message = "Pool is full, timeouting. " + _endPoint;

    if (_isDebugEnabled) _logger.LogDebug(message);

    result.Fail(message, new TimeoutException());

    // everyone is so busy

    return result;

}

改进后，压力测试结果立马与同步方法一样，100% 成功！

为什么会这样？

我们到 github 的 coreclr 仓库（针对 .net core 2.2）中看看 ManualResetEventSlim 与 Semaphore 的实现源码，看能否找到一些线索。

(一）

先看看 ManualResetEventSlim.Wait 方法的实现代码（523开始）：

1）先 SpinWait 等待

var spinner = new SpinWait();

while (spinner.Count < spinCount)

{

    spinner.SpinOnce(sleep1Threshold: -);

    if (IsSet)

    {

        return true;

    }

}

SpinWait 等待时间比较短，不会造成长时间阻塞线程。

在高并发下大量线程在争抢锁，所以大量线程在这个阶段等不到锁。

2）然后 Monitor.Wait 等待

try

{

    // ** the actual wait **

    if (!Monitor.Wait(m_lock, realMillisecondsTimeout))

        return false; //return immediately if the timeout has expired.

}

finally

{

    // Clean up: we're done waiting.

    Waiters = Waiters - ;

}

Monitor.Wait 对应的实现代码

[MethodImplAttribute(MethodImplOptions.InternalCall)]

private static extern bool ObjWait(bool exitContext, int millisecondsTimeout, object obj);

public static bool Wait(object obj, int millisecondsTimeout, bool exitContext)

{

    if (obj == null)

        throw (new ArgumentNullException(nameof(obj)));

    return ObjWait(exitContext, millisecondsTimeout, obj);

}

最终调用的是一个本地库的 ObjWait 方法。

查阅一下 Monitor.Wait 方法的帮助文档：

Releases the lock on an object and blocks the current thread until it reacquires the lock. If the specified time-out interval elapses, the thread enters the ready queue.

Monitor.Wait 的确会阻塞当前线程，这在异步高并发下会带来问题，详见一码阻塞，万码等待：ASP.NET Core 同步方法调用异步方法“死锁”的真相。

（二）

再看看 Semaphore 的实现代码，它继承自 WaitHandle ， Semaphore.Wait 实际调用的是 WaitHandle.Wait ，后者调用的是 WaitOneNative ，这是一个本地库的方法

[MethodImplAttribute(MethodImplOptions.InternalCall)]

private static extern int WaitOneNative(SafeHandle waitableSafeHandle, uint millisecondsTimeout, bool hasThreadAffinity, bool exitContext);

.net core 3.0 中有些变化，这里调用的是 WaitOneCore 方法

[MethodImpl(MethodImplOptions.InternalCall)]

private static extern int WaitOneCore(IntPtr waitHandle, int millisecondsTimeout);

查阅一下 WaitHandle.Wait 方法的帮助文档：

Blocks the current thread until the current WaitHandle receives a signal, using a 32-bit signed integer to specify the time interval in milliseconds.

WaitHandle.Wait 也会阻塞当前线程。

2个地方在等待锁时都会阻塞线程，难怪高并发下会出问题。

(三）

接着阅读 SemaphoreSlim 的源码学习它是如何在 WaitAsync 中实现异步等待锁的？

public Task<bool> WaitAsync(int millisecondsTimeout, CancellationToken cancellationToken)

{

    //...

    lock (m_lockObj!)

    {

        // If there are counts available, allow this waiter to succeed.

        if (m_currentCount > )

        {

            --m_currentCount;

            if (m_waitHandle != null && m_currentCount == ) m_waitHandle.Reset();

            return s_trueTask;

        }

        else if (millisecondsTimeout == )

        {

            // No counts, if timeout is zero fail fast

            return s_falseTask;

        }

        // If there aren't, create and return a task to the caller.

        // The task will be completed either when they've successfully acquired

        // the semaphore or when the timeout expired or cancellation was requested.

        else

        {

            Debug.Assert(m_currentCount == , "m_currentCount should never be negative");

            var asyncWaiter = CreateAndAddAsyncWaiter();

            return (millisecondsTimeout == Timeout.Infinite && !cancellationToken.CanBeCanceled) ?

                asyncWaiter :

                WaitUntilCountOrTimeoutAsync(asyncWaiter, millisecondsTimeout, cancellationToken);

        }

    }

}

重点看 else 部分的代码，SemaphoreSlim.WaitAsync 造了一个专门用于等待锁的 Task —— TaskNode ，CreateAndAddAsyncWaiter 就用于创建 TaskNode 的实例

private TaskNode CreateAndAddAsyncWaiter()

{

    // Create the task

    var task = new TaskNode();

    // Add it to the linked list

    if (m_asyncHead == null)

    {

        m_asyncHead = task;

        m_asyncTail = task;

    }

    else

    {

        m_asyncTail.Next = task;

        task.Prev = m_asyncTail;

        m_asyncTail = task;

    }

    // Hand it back

    return task;

}

从上面的代码看到 TaskNode 用到了链表，神奇的等锁专用 Task —— TaskNode 是如何实现的呢？

private sealed class TaskNode : Task<bool>

{

    internal TaskNode? Prev, Next;

    internal TaskNode() : base((object?)null, TaskCreationOptions.RunContinuationsAsynchronously) { }

}

好简单！

那 SemaphoreSlim.WaitAsync 如何用 TaskNode 实现指定了超时时间的锁等待？

看 WaitUntilCountOrTimeoutAsync 方法的实现源码：

private async Task<bool> WaitUntilCountOrTimeoutAsync(TaskNode asyncWaiter, int millisecondsTimeout, CancellationToken cancellationToken)

{

    // Wait until either the task is completed, timeout occurs, or cancellation is requested.

    // We need to ensure that the Task.Delay task is appropriately cleaned up if the await

    // completes due to the asyncWaiter completing, so we use our own token that we can explicitly

    // cancel, and we chain the caller's supplied token into it.

    using (var cts = cancellationToken.CanBeCanceled ?

        CancellationTokenSource.CreateLinkedTokenSource(cancellationToken, default(CancellationToken)) :

        new CancellationTokenSource())

    {

        var waitCompleted = Task.WhenAny(asyncWaiter, Task.Delay(millisecondsTimeout, cts.Token));

        if (asyncWaiter == await waitCompleted.ConfigureAwait(false))

        {

            cts.Cancel(); // ensure that the Task.Delay task is cleaned up

            return true; // successfully acquired

        }

    }

    // If we get here, the wait has timed out or been canceled.

    // If the await completed synchronously, we still hold the lock.  If it didn't,

    // we no longer hold the lock.  As such, acquire it.

    lock (m_lockObj)

    {

        // Remove the task from the list.  If we're successful in doing so,

        // we know that no one else has tried to complete this waiter yet,

        // so we can safely cancel or timeout.

        if (RemoveAsyncWaiter(asyncWaiter))

        {

            cancellationToken.ThrowIfCancellationRequested(); // cancellation occurred

            return false; // timeout occurred

        }

    }

    // The waiter had already been removed, which means it's already completed or is about to

    // complete, so let it, and don't return until it does.

    return await asyncWaiter.ConfigureAwait(false);

}

用 Task.WhenAny 等待 TaskNode 与 Task.Delay ，等其中任一者先完成，简单到可怕。

又一次通过 .net core 源码欣赏了高手是怎么玩转 Task 的。

【2019-5-6更新】

今天将 Task.WhenAny + Task.Delay 的招式用到了异步连接 Socket 的超时控制中

var connTask = _socket.ConnectAsync(_endpoint);

if (await Task.WhenAny(connTask, Task.Delay(_connectionTimeout)) == connTask)

{

    await connTask;

}

一次 .NET Core 中玩锁的经历：ManualResetEventSlim, Semaphore 与 SemaphoreSlim的更多相关文章

玩转ASP.NET Core中的日志组件
简介日志组件,作为程序员使用频率最高的组件,给程序员开发调试程序提供了必要的信息.ASP.NET Core中内置了一个通用日志接口ILogger,并实现了多种内置的日志提供器,例如 Console ...
ASP.NET Core 中文文档第三章原理（13）管理应用程序状态
原文:Managing Application State 作者:Steve Smith 翻译:姚阿勇(Dr.Yao) 校对:高嵩在 ASP.NET Core 中,有多种途径可以对应用程序的状态进行 ...
如何在 ASP.NET Core 中发送邮件
前言我们知道目前 .NET Core 还不支持 SMTP 协议,当我么在使用到发送邮件功能的时候,需要借助于一些第三方组件来达到目的,今天给大家介绍两款开源的邮件发送组件,它们分别是 MailKit ...
在 ASP.NET Core 中执行租户服务
在 ASP.NET Core 中执行租户服务不定时更新翻译系列,此系列更新毫无时间规律,文笔菜翻译菜求各位看官老爷们轻喷,如觉得我翻译有问题请挪步原博客地址本博文翻译自: http://gunna ...
浅析Entity Framework Core中的并发处理
前言 Entity Framework Core 2.0更新也已经有一段时间了,园子里也有不少的文章.. 本文主要是浅析一下Entity Framework Core的并发处理方式. 1.常见的并发处 ...
Net Core中数据库事务隔离详解——以Dapper和Mysql为例
Net Core中数据库事务隔离详解--以Dapper和Mysql为例事务隔离级别准备工作 Read uncommitted 读未提交 Read committed 读取提交内容 Repeatab ...
[翻译]在 .NET Core 中的并发编程
原文地址:http://www.dotnetcurry.com/dotnet/1360/concurrent-programming-dotnet-core 今天我们购买的每台电脑都有一个多核心的 C ...
.NET平台开源项目速览(20)Newlife.Core中简单灵活的配置文件
记得5年前开始拼命翻读X组件的源码,特别是XCode,但对Newlife.Core 的东西了解很少,最多只是会用用,而且用到的只是九牛一毛.里面好用的东西太多了. 最近一年时间,零零散散又学了很多,也 ...
ASP.Net Core 中使用Zookeeper搭建分布式环境中的配置中心系列一：使用Zookeeper.Net组件演示基本的操作
前言:马上要过年了,祝大家新年快乐!在过年回家前分享一篇关于Zookeeper的文章,我们都知道现在微服务盛行,大数据.分布式系统中经常会使用到Zookeeper,它是微服务.分布式系统中必不可少的分 ...

随机推荐

ebook https://salttiger.com/category/notification/
https://salttiger.com/category/notification/ 因为个人精力有限,持续搜集.整理.分享电子书已经占用我大部分业余时间,今后不再给评论区留言的朋友们找书,还希望 ...
Cocos2d-x 3.0final 终结者系列教程05-AppDelegate入口类
下面是Cocos2d-x的程序入口: class AppDelegate : private cocos2d::Application { public: AppDelegate(); virtua ...
小强的HTML5移动开发之路（43）——JqueryMobile页眉、工具栏和标签栏导航
一.页眉 1.添加页眉和页脚 <div data-role="header"> <h1>第 1 页</h1> </div> < ...
【t042】炮击坦克
Time Limit: 1 second Memory Limit: 128 MB [问题描述] 在一个坐标轴上,有M辆坦克,第i辆坦克在时刻0处于pos[i](pos[i]>0),speed[ ...
初始化NSDictionary：（工作经验）两种方法有时候效果不一样
方法1: NSMutableDictionary *dic = [[NSMutableDictionary alloc] init]; [dic setObject:[Hp_KeysArray obj ...
Erlang 转至维基百科
Erlang(英语发音:/ˈɜrlæŋ/)是一种通用的并行程序设计语言,它由乔·阿姆斯特朗(Joe Armstrong)在瑞典电信设备制造商爱立信所辖的计算机科学研究室开发,目的是创造一种可以应付大规 ...
TensorFlow 需注意的细节问题
1. 数据类型不带小数点的数默认为 int32,带小数点的数默认为 float32:
使用Opencv中均值漂移meanShift跟踪移动目标
Mean Shift均值漂移算法是无参密度估计理论的一种,无参密度估计不需要事先知道对象的任何先验知识,完全依靠训练数据进行估计,并且可以用于任意形状的密度估计,在某一连续点处的密度函数值可由该点邻域 ...
oracle的sql查询结果拼接
oracle数据库中,使用wm_concat(column)函数,可以进行字段合并 oracle wm_concat(column)函数使我们经常会使用到的,下面就教您如何使用oracle wm_co ...
一个自己犯的react错误
在看<react小书>高阶组件一节的时候,看到如下代码 import React, { Component } from 'react' export default (WrappedCo ...

一次 .NET Core 中玩锁的经历：ManualResetEventSlim, Semaphore 与 SemaphoreSlim

一次 .NET Core 中玩锁的经历：ManualResetEventSlim, Semaphore 与 SemaphoreSlim的更多相关文章

随机推荐

热门专题