如何为 .NET 在线客服系统的 Open Api 开放接口实现 QPS 限流功能
我在业余时间开发了一款自己的独立产品:升讯威在线客服与营销系统。陆陆续续开发了几年,从一开始的偶有用户尝试,到如今线上环境和私有化部署均有了越来越多的稳定用户。
而我收到的用户需求也越来越多,产品化的需求,个性化的需求都有。最近两天收到一个用户的开放接口需求,为客服系统的 Open Api 开放接口提供一个获取在线访客列表的接口。

如何在 .NET 系统中实现 Open Api 我在前文分解过,今天我想分享的是如何为在线客服系统的开放接口设计实现一个 QPS 限流功能。
如下图所示,在为用户提供接口的过程中,我对这个接口应用了基本的 QPS 限流技术。

什么是 QPS 接口限流
QPS(Queries Per Second,查询每秒)接口限流是指对 API 或网络服务的访问进行限制,控制每秒钟可以接受的最大请求数量。这种限流机制常用于防止服务器因为过多的请求而被过载,从而保证服务的稳定性和性能。
QPS 限流的具体做法通常是:
设置最大 QPS 限制:对于每个用户、IP 地址或系统等,设定一个请求次数上限。比如,一个接口每秒钟最多允许 100 次请求。
超限处理:当请求数超过设定的 QPS 限制时,系统通常会拒绝多余的请求,返回错误信息(如 HTTP 429 Too Many Requests)。有时,也可能选择进行排队、重试等处理。
分级限流:为了避免单一用户或 IP 造成整个系统的拥塞,可以根据用户类型、接口的优先级等进行不同的限流策略。
突发流量处理:对于突发的高频请求,系统可能允许短时间内的超出限制的请求,但会有相应的窗口期或滑动窗口来平滑流量。
QPS 限流的目的通常是:
- 防止恶意请求或过多请求导致服务崩溃。
- 确保公平性,避免单个用户或请求占用过多资源。
- 提高服务的可用性和稳定性。
.NET 接口有哪些QPS限流方案
1. 基于内存的限流(Memory-based Rate Limiting)
- 这种方法使用内存中的数据结构(如
Dictionary或Queue)来记录每个用户或请求的时间戳,从而计算每秒钟的请求数量。 - 适用于流量较小、对性能要求较高的场景。
示例:
public class MemoryRateLimiter
{
private readonly int _maxQps;
private readonly Dictionary<string, Queue<DateTime>> _requests = new Dictionary<string, Queue<DateTime>>();
public MemoryRateLimiter(int maxQps)
{
_maxQps = maxQps;
}
public bool IsRequestAllowed(string key)
{
var now = DateTime.UtcNow;
if (!_requests.ContainsKey(key))
{
_requests[key] = new Queue<DateTime>();
}
var requestQueue = _requests[key];
// Remove requests older than 1 second
while (requestQueue.Count > 0 && (now - requestQueue.Peek()).TotalSeconds >= 1)
{
requestQueue.Dequeue();
}
// Check if the current request exceeds the limit
if (requestQueue.Count >= _maxQps)
{
return false;
}
requestQueue.Enqueue(now);
return true;
}
}
2. 基于令牌桶算法(Token Bucket)
令牌桶算法是一种流量控制算法,它通过给每个请求一个令牌来限制流量。每秒钟会向桶中添加一定数量的令牌,只有获取到令牌的请求才能通过。
- 适合需要处理突发流量的场景,因为令牌桶可以在短时间内允许一定数量的超限请求。
- .NET 没有内置令牌桶算法,但可以自己实现或使用一些开源库(例如
RateLimiter包)。
示例:
public class TokenBucketRateLimiter
{
private readonly int _bucketCapacity;
private readonly int _tokensPerSecond;
private int _tokens;
private DateTime _lastRefillTime;
public TokenBucketRateLimiter(int bucketCapacity, int tokensPerSecond)
{
_bucketCapacity = bucketCapacity;
_tokensPerSecond = tokensPerSecond;
_tokens = bucketCapacity;
_lastRefillTime = DateTime.UtcNow;
}
public bool IsRequestAllowed()
{
var now = DateTime.UtcNow;
var elapsedSeconds = (now - _lastRefillTime).TotalSeconds;
// Refill tokens
if (elapsedSeconds > 1)
{
_tokens = Math.Min(_bucketCapacity, _tokens + (int)(elapsedSeconds * _tokensPerSecond));
_lastRefillTime = now;
}
// Check if we have tokens available
if (_tokens > 0)
{
_tokens--;
return true;
}
return false;
}
}
3. 基于滑动窗口(Sliding Window)
滑动窗口限流算法通过维护一个请求的时间窗口来限制请求次数。在窗口内,最多可以接受一定数量的请求。每次请求都会刷新这个窗口,并根据窗口内的请求数决定是否允许请求通过。
- 适合对请求的时间分布进行精确控制的场景。
- 实现相对复杂,但能更平滑地处理流量。
示例:
public class SlidingWindowRateLimiter
{
private readonly int _maxQps;
private readonly TimeSpan _windowSize;
private readonly Queue<DateTime> _requests = new Queue<DateTime>();
public SlidingWindowRateLimiter(int maxQps, TimeSpan windowSize)
{
_maxQps = maxQps;
_windowSize = windowSize;
}
public bool IsRequestAllowed()
{
var now = DateTime.UtcNow;
// Remove requests that are outside the window
while (_requests.Count > 0 && (now - _requests.Peek()).TotalMilliseconds > _windowSize.TotalMilliseconds)
{
_requests.Dequeue();
}
// Check if we can allow the request
if (_requests.Count < _maxQps)
{
_requests.Enqueue(now);
return true;
}
return false;
}
}
4. 使用第三方库(如 AspNetCoreRateLimit)
AspNetCoreRateLimit 是一个非常流行的 .NET 库,可以帮助开发者轻松实现 API 的限流。它支持多种限流算法,如固定窗口、滑动窗口、令牌桶等,并且可以在 ASP.NET Core 中使用。
安装 NuGet 包:
dotnet add package AspNetCoreRateLimit
配置示例:
public void ConfigureServices(IServiceCollection services)
{
// Add rate limiting services
services.AddInMemoryRateLimiting();
services.Configure<IpRateLimitOptions>(options =>
{
options.GeneralRules = new List<RateLimitRule>
{
new RateLimitRule
{
Endpoint = "*",
Period = "1s", // Limit requests per second
Limit = 100 // Max 100 requests per second
}
};
});
services.AddSingleton<IRateLimitConfiguration, RateLimitConfiguration>();
}
public void Configure(IApplicationBuilder app)
{
app.UseIpRateLimiting();
}
5. 使用 Redis 实现分布式限流
如果你的应用是分布式的,可以使用 Redis 来存储每个请求的时间戳或者计数器,从而实现跨多台服务器的 QPS 限流。
示例:
public class RedisRateLimiter
{
private readonly string _key;
private readonly int _maxQps;
private readonly IDatabase _database;
public RedisRateLimiter(string key, int maxQps, IConnectionMultiplexer redis)
{
_key = key;
_maxQps = maxQps;
_database = redis.GetDatabase();
}
public async Task<bool> IsRequestAllowedAsync()
{
var now = DateTime.UtcNow;
var timeFrame = TimeSpan.FromSeconds(1);
var requestCount = await _database.ListLengthAsync(_key);
// Remove expired requests from the list
await _database.ListRemoveAsync(_key, now.Add(-timeFrame).ToString());
if (requestCount < _maxQps)
{
// Add current request time to the list
await _database.ListLeftPushAsync(_key, now.ToString());
return true;
}
return false;
}
}
6. 基于 ASP.NET Core 中间件限流
在 ASP.NET Core 应用中,可以创建一个中间件来处理请求限流逻辑,并通过 HTTP 请求的头信息来告知客户端当前的请求状态。
示例:
public class RateLimitingMiddleware
{
private readonly RequestDelegate _next;
private readonly MemoryRateLimiter _rateLimiter;
public RateLimitingMiddleware(RequestDelegate next, MemoryRateLimiter rateLimiter)
{
_next = next;
_rateLimiter = rateLimiter;
}
public async Task InvokeAsync(HttpContext context)
{
if (!_rateLimiter.IsRequestAllowed(context.Connection.RemoteIpAddress.ToString()))
{
context.Response.StatusCode = 429;
await context.Response.WriteAsync("Rate limit exceeded.");
return;
}
await _next(context);
}
}
总结
在 .NET 中实现 QPS 限流有很多方案,对于小流量的应用,内存限流和基于中间件的限流方式可能已经足够,而对于高并发的分布式系统,可能需要 Redis 或者更复杂的算法,如令牌桶或滑动窗口。
简介下这个 .net 开发的小系统
升讯威在线客服与营销系统是一款客服软件,但更重要的是一款营销利器。
- 可以追踪正在访问网站或使用 APP 的所有访客,收集他们的浏览情况,使客服能够主动出击,施展话术,促进成单。
- 可嵌入网站、手机 APP、公众号、或者通过 URL 地址直接联系客服。
- 支持访客信息互通,可传输访客标识、名称和其它任意信息到客服系统,与您的业务系统对接。
- 可全天候 7 × 24 小时挂机运行,网络中断,拔掉网线,手机飞行模式,不掉线不丢消息,欢迎实测。


希望能够打造: 开放、开源、共享。努力打造 .net 社区的一款优秀开源产品。
钟意的话请给个赞支持一下吧,谢谢~
如何为 .NET 在线客服系统的 Open Api 开放接口实现 QPS 限流功能的更多相关文章
- .net core 和 WPF 开发升讯威在线客服系统:调用百度翻译接口实现实时自动翻译
业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程. 我把这款业余时间写的小系统丢在网上,陆续有人找我要私有化版本,我都给了,毕竟软件业的初衷就是免 ...
- 使用 WPF+ ASP.NET MVC 开发 在线客服系统 (一)
近段时间利用业余时间开发了一套在线客服系统,期间遇到过大大小小不少问题,好在都一一解决,最终效果也还可以,打算写一个系列的文章把开发过程详细的记录下来. 希望能够和更多的开发人员互相交流学习,也希望有 ...
- Vue在线客服系统【开源项目】
1. 项目介绍 一个基于Vue2.0的在线客服系统. 技术栈包含:Vue.VueX.Vue Router.Element UI. 2. 功能介绍 项目包含了2个模块:客服端和访客端. 2.1 客服端功 ...
- .net core 和 WPF 开发升讯威在线客服系统【私有化部署免费版】发布
希望 .net 和 WPF 技术时至今日,还能有一些存在感. 这个项目源于2015年前后,当时开发的初版,我使用了 ASP.NET MVC 做为后端,数据库使用原生 ADO.NET 进行操作.WPF ...
- CentOS 30分钟部署 .net core 在线客服系统
前段时间我发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程.期间有一些朋友希望能够给出 Linux 环境的安装部署指导,本文基于 CentOS 8.3 来安装部署.在本文中我 ...
- Docker 版 3分钟部署 .net core 开源在线客服系统,他来了
我在博客园发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程. 前些天又应朋友的要求,发了一篇 CentOS 版本的安装部署教程:https://www.cnblogs.com ...
- Linux + .net core 开发升讯威在线客服系统:同时支持 SQL Server 和 MySQL 的实现方法
前段时间我发表了一系列文章,开始介绍基于 .net core 的在线客服系统开发过程. 有很多朋友一直提出希望能够支持 MySQL 数据库,考虑到已经有朋友在用 SQL Server,我在升级的过程中 ...
- Linux + .net core 开发升讯威在线客服系统:首个经过实际验证的高性能版本
业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程: .net core 和 WPF 开发升讯威在线客服系统:目录 https://blog.she ...
- 使用 WPF + Chrome 内核实现 在线客服系统 的复合客服端程序
本系列文章详细介绍使用 .net core 和 WPF 开发 升讯威在线客服与营销系统 的过程.本产品已经成熟稳定并投入商用. 免费使用 & 私有化部署免费下载:https://docs.sh ...
- .net core 和 WPF 开发升讯威在线客服系统:把 .Net Framework 打包进安装程序
本系列文章详细介绍使用 .net core 和 WPF 开发 升讯威在线客服与营销系统 的过程. 系列文章目录: https://blog.shengxunwei.com/Home/Post/44a3 ...
随机推荐
- GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
GPUStack 是一个专为运行 AI 模型设计的开源 GPU 集群管理器,致力于支持基于任何品牌的异构 GPU 构建统一管理的算力集群.无论这些 GPU 运行在 Apple Mac.Windows ...
- 真正“搞”懂HTTPS协议19之HTTPS优化
这是本系列的最后一篇了,其实本篇的内容也跟前两篇TLS的握手和优化有关系.其实HTTPS的核心就是TLS的明文握手连接,前两篇我们花了很大的篇幅来聊这些,另外一个就是在TLS握手完成后的密文传输部分了 ...
- cockpit-325以及新版本安装和cockpit-files安装
查看版本cockpit可安装版本,发现最新的只有310版本 sudo yum list cockpit --showduplicates Last metadata expiration check: ...
- 论文解读《The Philosopher’s Stone: Trojaning Plugins of Large Language Models》
发表时间:2025 期刊会议:Network and Distributed System Security (NDSS) Symposium 论文单位:Shanghai Jiao Tong Univ ...
- Centos查找Tomcat路径并重启
[root@devrestcloud ~\]# find / -name \*tomcat\* [root@devrestcloud ~]# cd /usr/tomcat/apache-tomcat- ...
- 【pygame】Python小游戏开发之看代码学编程
话说我学习的时候,英文文档难以理解,中文文档杂乱无章,最终还是觉得,还不如直接看代码学习. 下面是我学习过程中写的代码,注释写的很详细,我想会帮助你理解的 pip install pygame 1.游 ...
- 国产系统UOS上的视频监控系统
一.功能特点 (一)软件模块 视频监控模块,各种停靠小窗体子模块,包括设备列表.图文警情.窗口信息.云台控制.预置位.巡航设置.设备控制.悬浮地图.网页浏览等. 视频回放模块,包括本地回放.远程回放. ...
- SpringBoot 集成Swagger后提通过http://localhost:8001/swagger-ui.html#/访问得不到页面
SpringBoot 集成Swagger后提通过http://localhost:8001/swagger-ui.html#/访问得不到页面: spring boot 集成 swagger2步骤: ...
- 《Bootstrap4Web设计与开发实战》源代码下载
<Bootstrap4Web设计与开发实战>源代码下载: 链接:https://pan.baidu.com/s/1GaIo390c-l-gsT6-6RaaJA 提取码:fgiq 版权声明: ...
- Windows下的GDAL环境配置
Windows下的GDAL环境配置 在Windows下GDAL环境的配置方式有很多种,我尝试了很多不同的配置方式,包括Anaconda. GISInternals.QGIS.OSGeo4W等, 我这里 ...