背景

我在业余时间开发了一款自己的独立产品:升讯威在线客服与营销系统。陆陆续续开发了几年,从一开始的偶有用户尝试,到如今的 QPS 突破 240 次/秒,连接数突破 4000,日请求数接近 1000 万。(PS:阿里云真贵啊

在这篇文章中,我将简要介绍我在技术上做了哪些工作,我是如何做到的。

PS:

虽然在线使用是免费的,有条件的用户也可以自行下载私有化部署包,安装部署在自己的服务器使用。(https://kf.shengxunwei.com/

我做的是个什么产品

先简单看一下这款 QPS 突破 240 次/秒,日请求数接近 1000 万的个人独立产品,它是个啥?直接上图,是一款在线客服系统:

https://kf.shengxunwei.com/

100% 免费下载私有化部署,希望能够打造: 开放、开源、共享。努力打造 .net 社区的一款优秀开源产品。

我是如何做到高 QPS 的?

深入 .NET 多线程技术

死锁和争用条件

多线程处理解决了吞吐量和响应性问题,但引入此功能会带来新的问题:死锁和争用条件。

死锁

两个线程中的每一个线程都尝试锁定另外一个线程已锁定的资源时,就会发生死锁。 两个线程都不能继续执行。

托管线程处理类的许多方法都提供了超时设定,有助于检测死锁。 例如,下面的代码尝试在 lockObject 对象上获取锁。 如果在 300 毫秒内没有获取锁,Monitor.TryEnter 返回 false。

if (Monitor.TryEnter(lockObject, 300)) {
try {
// Place code protected by the Monitor here.
}
finally {
Monitor.Exit(lockObject);
}
}
else {
// Code to execute if the attempt times out.
}

争用条件

争用条件是程序的结果取决于两个或更多个线程中的哪一个先到达某一特定代码块时出现的一种 bug。 多次运行程序会产生不同的结果,并且无法预测任何给定运行的结果。

争用条件的一个简单例子是递增一个字段。 假定某个类有一个私有 static 字段(在 Visual Basic 中为 Shared),每创建该类的一个实例时它都递增一次,使用的代码是 objCt++; (C#) 或 objCt += 1 (Visual Basic)。 此操作要求将 objCt 的值加载到寄存器中,使该值递增,然后将其存储到 objCt 中。

在多线程应用程序中,一个已加载并递增该值的线程可能会被另一个线程抢先,抢先的线程执行全部三个步骤;第一个线程继续执行并存储其值时,它会覆盖 objCt,但不考虑该值在其暂停执行期间已更改这一事实。

通过使用 Interlocked 类的方法(如 Interlocked.Increment),可以轻松避免这种争用条件。 若要了解在多个线程间同步数据的其他技巧,请参阅为多线程处理同步数据。

争用条件也可能会在同步多个线程的活动时发生。 编写每一行代码时,都必须考虑出现以下情况时会发生什么情况:一个线程在执行该行代码(或构成该行的任何机器指令)前,其他线程抢先执行了该代码。

静态成员和静态构造函数

在类的类构造函数(C# 中为 static 构造函数、Visual Basic 中为 Shared Sub New)完成运行之前,该类不会初始化。 为防止对未初始化的类型执行代码,在类构造函数完成运行之前,公共语言运行时会禁止从其他线程到类的 static 成员(在 Visual Basic 中为 Shared 成员)的所有调用。

例如,如果某个类构造函数启动了一个新线程,并且该线程过程调用了该类的 static 成员,则在该类构造函数完成之前,会一直禁止新线程。

以上情况适用于可拥有 static 构造函数的任意类型。

建议

使用多线程时需考虑以下准则:

  • 不要使用 Thread.Abort 终止其他线程。 对另一个线程调用 Abort 无异于引发该线程的异常,也不知道该线程已处理到哪个位置。

  • 不要使用 Thread.Suspend 和 Thread.Resume 同步多个线程的活动。 请使用 Mutex、ManualResetEvent、AutoResetEvent 和 Monitor。

  • 不要从主程序中控制工作线程的执行(如使用事件)。 而应设计程序,使工作线程负责等待任务可用,然后执行任务,并在完成时通知程序的其他部分。 如果不阻止工作线程,请考虑使用线程池线程。 Monitor.PulseAll 非常适用于阻止工作线程。

  • 不要将类型用作锁定对象。 也就是说,避免一些代码,或避免使用 Monitor.Enter 和 Type 对象。 对于给定类型,每个应用域只有一个 System.Type 实例。 如果锁定对象的类型是“公共的”,那么不属于自己的代码也能锁定该对象,从而导致死锁。 有关其他问题,请参阅可靠性最佳做法。

  • 锁定实例时要谨慎,例如,C# 中的 lock(this) 或 Visual Basic 中的 SyncLock(Me)。 如果应用程序中不属于该类型的其他代码锁定了该对象,则会发生死锁。

  • 务必确保已进入监视器的线程始终离开该监视器,即使线程在监视器中时发生异常也是如此。 C# 的 lock 语句和 Visual Basic 的 SyncLock 语句可自动提供此行为,同时使用 finally 块来确保调用 Monitor.Exit。 如果无法确保调用 Exit,请考虑将设计更改为使用 Mutex。 Mutex 在当前拥有它的线程终止后会自动释放。

  • 务必针对需要不同资源的任务使用多线程,避免向单个资源指定多个线程。 例如,任何涉及 I/O 的任务都会从其拥有自己的线程这一点得到好处,因为此线程在 I/O 操作期间将阻止,从而允许其他线程执行。 用户输入是另一种可从专用线程获益的资源。 在单处理器计算机上,涉及大量计算的任务可与用户输入和涉及 I/O 的任务并存,但多个计算量大的任务将相互竞争。

类库相关建议

为多线程处理设计类库时,考虑以下准则:

  • 如果可能,避免同步需求。 对于大量使用的代码更应如此。 例如,可以将一个算法调整为容忍争用情况,而不是完全消除争用情况。 不必要的同步会降低性能,并且可能导致出现死锁和争用情况。

  • 默认情况下使静态数据(在 Visual Basic 中为 Shared)是线程安全的。

  • 默认情况下不要使实例数据是线程安全的。 通过添加锁来创建线程安全代码会降低性能、加剧锁争用情况,并且可能导致出现死锁。 在常见应用程序模型中,一次只有一个线程执行用户代码,从而最大限度降低线程安全性的需求。 出于此原因,.NET 类库在默认情况下不是线程安全的类库。

  • 避免提供可更改静态状态的静态方法。 在常见服务器方案中,静态状态可在各个请求之间共享,这意味着多个线程可同时执行该代码。 这可能导致线程出现 bug。 请考虑使用一种设计模式,将数据封装到在各请求之间不共享的实例中。 此外,如果同步静态数据,更改状态的静态方法间的调用可导致死锁或冗余同步,进而降低性能。


钟意的话请给个赞支持一下吧,谢谢~

在线客服系统 QPS 突破 240/秒,连接数突破 4000,日请求数接近1000万次,.NET 多线程技术的高性能实践的更多相关文章

  1. .net core 和 WPF 开发升讯威在线客服系统:调用百度翻译接口实现实时自动翻译

    业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程. 我把这款业余时间写的小系统丢在网上,陆续有人找我要私有化版本,我都给了,毕竟软件业的初衷就是免 ...

  2. .net core 和 WPF 开发升讯威在线客服系统:调用有道翻译接口实现实时自动翻译的方法

    业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程. 我把这款业余时间写的小系统丢在网上,陆续有人找我要私有化版本,我都给了,毕竟软件业的初衷就是免 ...

  3. Linux + .net core 开发升讯威在线客服系统:首个经过实际验证的高性能版本

    业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程: .net core 和 WPF 开发升讯威在线客服系统:目录 https://blog.she ...

  4. 使用 WPF+ ASP.NET MVC 开发 在线客服系统 (一)

    近段时间利用业余时间开发了一套在线客服系统,期间遇到过大大小小不少问题,好在都一一解决,最终效果也还可以,打算写一个系列的文章把开发过程详细的记录下来. 希望能够和更多的开发人员互相交流学习,也希望有 ...

  5. Vue在线客服系统【开源项目】

    1. 项目介绍 一个基于Vue2.0的在线客服系统. 技术栈包含:Vue.VueX.Vue Router.Element UI. 2. 功能介绍 项目包含了2个模块:客服端和访客端. 2.1 客服端功 ...

  6. .net core 和 WPF 开发升讯威在线客服系统【私有化部署免费版】发布

    希望 .net 和 WPF 技术时至今日,还能有一些存在感. 这个项目源于2015年前后,当时开发的初版,我使用了 ASP.NET MVC 做为后端,数据库使用原生 ADO.NET 进行操作.WPF ...

  7. CentOS 30分钟部署 .net core 在线客服系统

    前段时间我发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程.期间有一些朋友希望能够给出 Linux 环境的安装部署指导,本文基于 CentOS 8.3 来安装部署.在本文中我 ...

  8. Docker 版 3分钟部署 .net core 开源在线客服系统,他来了

    我在博客园发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程. 前些天又应朋友的要求,发了一篇 CentOS 版本的安装部署教程:https://www.cnblogs.com ...

  9. Linux + .net core 开发升讯威在线客服系统:同时支持 SQL Server 和 MySQL 的实现方法

    前段时间我发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程. 有很多朋友一直提出希望能够支持 MySQL 数据库,考虑到已经有朋友在用 SQL Server,我在升级的过程中 ...

  10. 使用 WPF + Chrome 内核实现 在线客服系统 的复合客服端程序

    本系列文章详细介绍使用 .net core 和 WPF 开发 升讯威在线客服与营销系统 的过程.本产品已经成熟稳定并投入商用. 免费使用 & 私有化部署免费下载:https://docs.sh ...

随机推荐

  1. downloadFile:base64数据导出文件,文件下载

    function downloadFile(filename, data){ let DownloadLink = document.createElement('a'); if ( Download ...

  2. 【一步步开发AI运动小程序】十四、主包超出2M大小限制,如何将插件分包发布?

    随着人工智能技术的不断发展,阿里体育等IT大厂,推出的"乐动力"."天天跳绳"AI运动APP,让云上运动会.线上运动会.健身打卡.AI体育指导等概念空前火热.那 ...

  3. elementui resetFields()不起作用

    需要结合prop才有作用

  4. 推送本地镜像到 Harbor

    1.harbor没有启动 https 我本地 安装 harbor 的时候由于没有使用证书,所以将 harbor.yml https 注释掉. 2.配置docker镜像地址 比如 我的 ip 为 192 ...

  5. Beautiful of programming

    作者:Linus Torvalds 我不知道该如何清楚地描述我对编程的痴迷.对编程的人来说,这是世界上最有趣的事情.这是一个比国际象棋更复杂的游戏,在这个游戏中,你可以制定自己的规则,并基于这些规则得 ...

  6. C++中的多线程及其之后的周边

    多线程 参考:https://zhuanlan.zhihu.com/p/613630658 平台差异:Linux 与 Windows,跨平台方案 在Linux上,有pthread的使用,而C++ 11 ...

  7. 高精度计算库math.js使用踩坑记

    前情 最近在做一个后端需求,需求中需要前端做一些金额数字计算,前端对于小数的计算一直都有精度问题,如0.1+0.2计算的结果并不是0.3,而是0.30000000000000004,于是引入高精度计算 ...

  8. vtkDelaunay2D 错误 Edge not recovered, polygon fill suspect

    vtkDelaunay2D 在设定SetSourceData边界处理凹多边形时,不稳定,有概率会出现"Edge not recovered, polygon fill suspect&quo ...

  9. RPM 与 YUM

    RPM 与 YUM rpm 包的管理 rpm 用于互联网下载包的打包及安装工具,它包含在某些 Linux 分发版中.它生成具有.RPM 扩展名的文件.RPM是 RedHat Package Manag ...

  10. 从底层源码深入分析Spring的IoC容器初始化过程

    IOC容器的初始化整体过程 Spring是如何实现将资源配置(以xml配置为例)通过加载,解析,生成BeanDefination并注册到IoC容器中的?这主要会经过以下 4 步: 从XML中读取配置文 ...