背景

之前在.NET 性能优化群内交流时,我们发现很多朋友对于高性能网络框架有需求,需要创建自己的消息服务器、游戏服务器或者物联网网关。但是大多数小伙伴只知道 DotNetty,虽然 DotNetty 是一个非常优秀的网络框架,广泛应用于各种网络服务器中,不过因为各种原因它已经不再有新的特性支持和更新,很多小伙伴都在寻找替代品。

这一切都不用担心,在.NET Core 以后的时代,我们有了更快、更强、更好的 Kestrel 网络框架,正如其名,Kestrel 中文翻译为红隼(hóng sǔn)封面就是红隼的样子,是一种飞行速度极快的猛禽。Kestrel 是 ASPNET Core 成为.NET 平台性能最强 Web 服务框架的原因之一,但是很多人还觉得 Kestrel 只是用于 ASPNET Core 的网络框架,但是其实它是一个高性能的通用网络框架。

我和拥有多个.NET 千星开源项目作者九哥一拍即合,为了让更多的人了解 Kestrel,计划写一系列的文章来介绍它,九哥已经写了一系列的文章来介绍如何使用Kestrel来创建网络服务,我觉得他写的已经很深入和详细了,于是没有编写的计划。

不过最近发现还是有很多朋友在群里面问这样的问题,还有群友提到如何使用Kestrel来实现一个RPC框架,刚好笔者在前面一段时间研究了一下这个,所以这一篇文章也作为Kestrel的应用篇写给大家,目前来说想分为几篇文章来发布,大体的脉络如下所示,后续看自己的时间和读者们感兴趣的点再调整内容。

  • 整体设计
  • Kestrel服务端实现
    • 请求、响应序列化及反序列化
    • 单链接多路复用实现
    • 性能优化
  • Client实现
    • 代码生成技术
  • 待定……

项目

本文对应的项目源码已经开源在Github上,由于时间仓促,笔者只花了几天时间设计和实现这个RPC框架,所以里面肯定有一些设计不合理或者存在BUG的地方,还需要大家帮忙查缺补漏。

SatelliteRpc: https://github.com/InCerryGit/SatelliteRpc

如果对您有帮助,欢迎点个star~

再次提醒注意:该项目只作为学习、演示使用,没有经过生产环境的检验。

项目信息

编译环境

要求 .NET 7.0 SDK 版本,Visual Studio 和 Rider 对应版本都可以。

目录结构

├─samples                   // 示例项目
│ ├─Client // 客户端示例
│ │ └─Rpc // RPC客户端服务
│ └─Server // 服务端示例
│ └─Services // RPC服务端服务
├─src // 源代码
│ ├─SatelliteRpc.Client // 客户端
│ │ ├─Configuration // 客户端配置信息
│ │ ├─Extensions // 针对HostBuilder和ServiceCollection的扩展
│ │ ├─Middleware // 客户端中间件,包含客户端中间件的构造器
│ │ └─Transport // 客户端传输层,包含请求上下文,默认的客户端和Rpc链接的实现
│ ├─SatelliteRpc.Client.SourceGenerator // 客户端代码生成器,用于生成客户端的调用代码
│ ├─SatelliteRpc.Protocol // 协议层,包含协议的定义,协议的序列化和反序列化,协议的转换器
│ │ ├─PayloadConverters // 承载数据的序列化和反序列化,包含ProtoBuf
│ │ └─Protocol // 协议定义,请求、响应、状态和给出的Login.proto
│ ├─SatelliteRpc.Server // 服务端
│ │ ├─Configuration // 服务端配置信息,还有RpcServer的构造器
│ │ ├─Exceptions // 服务端一些异常
│ │ ├─Extensions // 针对HostBuilder、ServiceCollection、WebHostBuilder的扩展
│ │ ├─Observability // 服务端的可观测性支持,目前实现了中间件
│ │ ├─RpcService // 服务端的具体Rpc服务的实现
│ │ │ ├─DataExchange // 数据交换,包含Rpc服务的数据序列化
│ │ │ ├─Endpoint // Rpc服务的端点,包含Rpc服务的端点,寻址,管理
│ │ │ └─Middleware // 包含Rpc服务的中间件的构造器
│ │ └─Transport // 服务端传输层,包含请求上下文,服务端的默认实现,Rpc链接的实现,链接层中间件构建器
│ └─SatelliteRpc.Shared // 共享层,包含一些共享的类
│ ├─Application // 应用层中间件构建基类,客户端和服务端中间件构建都依赖它
│ └─Collections // 一些集合类
└─tests // 测试项目
├─SatelliteRpc.Protocol.Tests
├─SatelliteRpc.Server.Tests
└─SatelliteRpc.Shared.Tests

演示

安装好SDK和下载项目以后,samples目录是对应的演示项目,这个项目就是通过我们的RPC框架调用Server端创建的一些服务,先启动Server然后再启动Client就可以得到如下的运行结果:

设计方案

下面简单的介绍一下总体的设计方案:

传输协议设计

传输协议的主要代码在SatelliteRpc.Protocol项目中,协议的定义在Protocol目录下。针对RPC的请求和响应创建了两个类,一个是AppRequest另一个是AppResponse

在代码注释中,描述了协议的具体内容,这里简单的介绍一下,请求协议定义如下:

[请求总长度][请求Id][请求的路径(字符串)]['\0'分隔符][请求数据序列化类型][请求体]

响应协议定义如下:

[响应总长度][请求Id][响应状态][响应数据序列化类型][响应体]

其中主要的参数和数据在各自请求响应体中,请求体和响应体的序列化类型是通过PayloadConverters中的序列化器进行序列化和反序列化的。

在响应时使用了请求Id,这个请求Id是ulong类型,是一个链接唯一的自增的值,每次请求都会自增,这样就可以保证每次请求的Id都是唯一的,这样就可以在客户端和服务端进行匹配,从而找到对应的请求,从而实现多路复用的请求和响应匹配功能。

当ulong类型的值超过最大值时,会从0开始重新计数,由于ulong类型的值是64位的,值域非常大,所以在正常的情况下,同一连接下不可能出现请求Id重复的情况。

客户端设计

客户端的层次结构如下所示,最底层是传输层的中间件,它由RpcConnection生成,它用于TCP网络连接和最终的发送接受请求,中间件构建器保证了它是整个中间件序列的最后的中间件,然后上层就是用户自定义的中间件。

默认的客户端实现DefaultSatelliteRpcClient,目前只提供了几个Invoke方法,用于不同传参和返参的服务,在这里会执行中间件序列,最后就是具体的LoginClient实现,这里方法定义和ILoginClient一致,也和服务端定义一致。

最后就是调用的代码,现在有一个DemoHostedService的后台服务,会调用一下方法,输出日志信息。

下面是一个层次结构图:

[用户层代码]
|
[LoginClient]
|
[DefaultSatelliteRpcClient]
|
[用户自定义中间件]
|
[RpcConnection]
|
[TCP Client]

所以整个RCP Client的关键实体的转换如下图所示:

请求:[用户PRC 请求响应契约][CallContext - AppRequest&AppResponse][字节流]
响应:[字节流][CallContext - AppRequest&AppResponse][用户PRC 请求响应契约]

多路复用

上文提到,多路复用主要是使用ulong类型的Id来匹配Request和Response,主要代码在RpcConnection,它不仅提供了一个最终用于发送请求的方法,

在里面声明了一个TaskCompletionSource的字典,用于存储请求Id和TaskCompletionSource的对应关系,这样就可以在收到响应时,通过请求Id找到对应的TaskCompletionSource,从而完成请求和响应的匹配。

由于请求可能是并发的,所以在RpcConnection中声明了Channel<AppRequest>,将并发的请求放入到Channel中,然后在RpcConnection中有一个后台线程,用于从Channel单线程的中取出请求,然后发送请求,避免并发调用远程接口时,底层字节流的混乱。

扩展性

客户端不仅仅支持ILoginClient这一个契约,用户可以自行添加其他契约,只要保障服务端有相同的接口实现即可。也支持增加其它proto文件,Protobuf.Tools会自动生成对应的实体类。

中间件

该项目的扩展性类似ASP.NET Core的中间件,可以自行加入中间件处理请求和响应,中间件支持Delegate形式,也支持自定义中间件类的形式,如下代码所示:

public class MyMiddleware : IRpcClientMiddleware
{
public async Task InvokeAsync(ApplicationDelegate<CallContext> next, CallContext next)
{
// do something
await next(context);
// do something
}
}

在客户端中间件中,可以通过CallContext获取到请求和响应的数据,然后可以对数据进行处理,然后调用next方法,这样就可以实现中间件的链式调用。

同样也可以进行阻断操作,比如在某个中间件中,直接返回响应,这样就不会继续调用后面的中间件;或者记录请求响应日志,或者进行一些其他的操作,类似于ASP.NET Core中间件都可以实现。

序列化

序列化的扩展性主要是通过PayloadConverters来实现的,内部实现了抽象了一个接口IPayloadConverter,只要实现对应PayloadType的序列化和反序列化方法即可,然后注册到DI容器中,便可以使用。

由于时间关系,只列出了Protobuf和Json两种序列化器,实际上可以支持用户自定义序列化器,只需要在请求响应协议中添加标识,然后由用户注入到DI容器即可。

其它

其它一些类的实现基本都是通过接口和依赖注入的方式实现,用户可以很方便的进行扩展,在DI容器中替换默认实现即可。如:IRpcClientMiddlewareBuilder

IRpcConnectionISatelliteRpcClient等。

另外也可以自行添加其他的服务,因为代码生成器会自动扫描接口,然后生成对应的调用代码,所以只需要在接口上添加SatelliteRpcAttribute,声明好方法契约,就能实现。

服务端设计

服务端的设计总体和客户端设计差不多,中间唯一有一点区别的地方就是服务端的中间件有两种:

  • 一种是针对连接层的RpcConnectionApplicationHandler中间件,设计它的目的主要是为了灵活处理链接请求,由于可以直接访问原始数据,还没有做路由和参数绑定,后续可观测性指标和一些性能优化在这里做会比较方便。

    • 比如为了应对RPC调用,定义了一个名为RpcServiceHandlerRpcConnectionApplicationHandler中间件,放在整个连接层中间件的最后,这样可以保证最后执行的是RPC Service层的逻辑。
  • 另外一种是针对业务逻辑层的RpcServiceMiddleware,这里就是类似ASP.NET Core的中间件,此时上下文中已经有了路由信息和参数绑定,可以在这做一些AOP编程,也能直接调用对应的服务方法。
    • 在RPC层,我们需要完成路由,参数绑定,执行目标方法等功能,这里就是定义了一个名为EndpointInvokeMiddleware的中间件,放在整个RPC Service层中间件的最后,这样可以保证最后执行的是RPC Service层的逻辑。

下面是一个层次结构图:

[用户层代码]
|
[LoginService]
|
[用户自定义的RpcServiceMiddleware]
|
[RpcServiceHandler]
|
[用户自定义的RpcConnectionApplicationHandler]
|
[RpcConnectionHandler]
|
[Kestrel]

整个RPC Server的关键实体的转换如下图所示:

请求:[字节流][RpcRawContext - AppRequest&AppResponse][ServiceContext][用户PRC Service 请求契约]
响应:[用户PRC Service 响应契约][ServiceContext][AppRequest&AppResponse][字节流]

多路复用

服务端对于多路复用的支持就简单的很多,这里是在读取到一个完整的请求以后,直接使用Task.Run执行后续的逻辑,所以能做到同一链接多个请求并发执行,

对于响应为了避免混乱,使用了Channel<HttpRawContext>,将响应放入到Channel中,然后在后台线程中单线程的从Channel中取出响应,然后返回响应。

终结点

在服务端中有一个终结点的概念,这个概念和ASP.NET Core中的概念类似,它具体的实现类是RpcServiceEndpoint;在程序开始启动以后;

便会扫描入口程序集(当然这块可以优化),然后找到所有的RpcServiceEndpoint,然后注册到DI容器中,然后由RpcServiceEndpointDataSource统一管理,

最后在进行路由时有IEndpointResolver根据路径进行路由,这只提供了默认实现,用户也可以自定义实现,只需要实现IEndpointResolver接口,然后替换DI容器中的默认实现即可。

扩展性

服务端的扩展性也是在中间件序列化其它接口上,可以通过DI容器很方便的替换默认实现,增加AOP切面等功能,也可以直接添加新的Service服务,因为会默认去扫描入口程序集中的RpcServiceEndpoint,然后注册到DI容器中。

优化

现阶段做的性能优化主要是以下几个方面:

  • Pipelines

    • 在客户端的请求和服务端处理(Kestrel底层使用)中都使用了Pipelines,这样不仅可以降低编程的复杂性,而且由于直接读写Buffer,可以减少内存拷贝,提高性能。
  • 表达式树
    • 在动态调用目标服务的方法时,使用了表达式树,这样可以减少反射的性能损耗,在实际场景中可以设置一个快慢阈值,当方法调用次数超过阈值时,就可以使用表达式树来调用方法,这样可以提高性能。
  • 代码生成
    • 在客户端中,使用了代码生成技术,这个可以让用户使用起来更加简单,无需理解RPC的底层实现,只需要定义好接口,然后使用代码生成器生成对应的调用代码即可;另外实现了客户端自动注入,避免运行时反射注入的性能损耗。
  • 内存复用
    • 对于RPC框架来说,最大的内存开销基本就在请求和响应体上,创建了PooledArray和PooledList,两个池化的底层都是使用的ArrayPool,请求和响应的Payload都是使用的池化的空间。
  • 减少内存拷贝
    • RPC框架消耗CPU的地方是内存拷贝,上文提到了客户端和服务端均使用Pipelines,在读取响应和请求的时候直接使用ReadOnlySequence<byte>读取网络层数据,避免拷贝。
    • 客户端请求和服务端响应创建了PayloadWriter类,通过IBufferWriter<byte>直接将序列化的结果写入网络Buffer中,减少内存拷贝,虽然会引入闭包开销,但是相对于内存拷贝来说,几乎可以忽略。
    • 对于这个优化实际应该设置一个阈值,当序列化的数据超过阈值时,才使用PayloadWriter,否则使用内存拷贝的方式,需要Benchmark测试支撑阈值设置。

其它更多的性能优化需要Benchmark的数据支持,由于时间比较紧,没有做更多的优化。

待办

计划做,但是没有时间去实现的:

  • 服务端代码生成

    • 现阶段服务端的路由是通过字典匹配实现,方法调用使用的表达式树,实际上这一块可以使用代码生成来实现,这样可以提高性能。
    • 另外一个地方就是Endpoint注册是通过反射扫描入口程序集实现的,实际上这一步可以放在编译阶段处理,在编译时就可以读取到所有的服务,然后生成代码,这样可以减少运行时的反射。
  • 客户端取消请求
    • 目前客户端的请求取消只是在客户端本身,取消并不会传递到服务端,这一块可以通过协议来实现,在请求协议中添加一个标识,传递Cancel请求,然后在服务端进行判断,如果是取消请求,则服务端也根据ID取消对应的请求。
  • Context 和 AppRequest\AppResponse 池化
    • 目前的Context和AppRequest\AppResponse都是每次请求都会创建,对于这些小对象可以使用池化的方式来实现复用,其中AppRequest、AppResponse已经实现了复用的功能,但是没有时间去实现池化,Context也可以实现池化,但是目前没有实现。
  • 堆外内存、FOH管理
    • 目前的内存管理都是使用的堆内存,对于那些有明显作用域的对象和缓存空间可以使用堆外内存或FOH来实现,这样可以减少GC在扫描时的压力。
  • AsyncTask的内存优化
    • 目前是有一些地方使用的ValueTask,对于这些地方也是内存分配的优化方向,可以使用PoolingAsyncValueTaskMethodBuilder来池化ValueTask,这样可以减少内存分配。
    • TaskCompletionSource也是可以优化的,后续可以使用AwaitableCompletionSource来降低分配。
  • 客户端连接池化
    • 目前客户端的连接还是单链接,实际上可以使用连接池来实现,这样可以减少TCP链接的创建和销毁,提高性能。
  • 异常场景处理
    • 目前对于服务端和客户端来说,没有详细的测试,针对TCP链接断开,数据包错误,服务器异常等场景的重试,熔断等策略都没有实现。

构建SatelliteRpc:基于Kestrel的RPC框架(整体设计篇)的更多相关文章

  1. 这样基于Netty重构RPC框架你不可能知道

    原创申明:本文由公众号[猿灯塔]原创,转载请说明出处标注 今天是猿灯塔“365天原创计划”第5天. 今天呢!灯塔君跟大家讲: 基于Netty重构RPC框架 一.CyclicBarrier方法说明 1. ...

  2. 《手把手教你》系列基础篇(九十六)-java+ selenium自动化测试-框架之设计篇-跨浏览器(详解教程)

    1.简介 从这一篇开始介绍和分享Java+Selenium+POM的简单自动化测试框架设计.第一个设计点,就是支持跨浏览器测试. 宏哥自己认为的支持跨浏览器测试就是:同一个测试用例,支持用不同浏览器去 ...

  3. Apache thrift - 使用,内部实现及构建一个可扩展的RPC框架

    本文首先介绍了什么是Apache Thrift,接着介绍了Thrift的安装部署及如何利用Thrift来实现一个简单的RPC应用,并简单的探究了一下Thrift的内部实现原理,最后给出一个基于Thri ...

  4. 手动造轮子——基于.NetCore的RPC框架DotNetCoreRpc

    前言     一直以来对内部服务间使用RPC的方式调用都比较赞同,因为内部间没有这么多限制,最简单明了的方式就是最合适的方式.个人比较喜欢类似Dubbo的那种使用方式,把接口层单独出来,作为服务的契约 ...

  5. 一个简单的基于BIO的RPC框架

    github地址:https://github.com/Luyu05/BioRpcExample PART1:先来整体看下项目的构成 其中bio-rpc-core就是所谓的rpc框架 bio-rpc- ...

  6. 基于Netty重构RPC框架

    下面的这张图,大概很多小伙伴都见到过,这是Dubbo 官网中的一张图描述了项目架构的演进过程.随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在 ...

  7. 基于netty实现rpc框架-spring boot服务端

    demo地址 https://gitee.com/syher/grave-netty RPC介绍 首先了解一下RPC:远程过程调用.简单点说就是本地应用可以调用远程服务器的接口.那么通过什么方式调用远 ...

  8. 基于 SOA 概念 RPC 框架 的 消息中心 云部署 设计 漫谈

    一.背景 假设有一个系统的最大并发量有2000TPS左右.同时该系统有闲时和忙时,希望可以随时进行拓展和削减服务能力,以节省服务器费用开销. 该系统能提供站内消息.短信.app消息.邮箱的一个消息系统 ...

  9. 基于RabbitMQ的Rpc框架

    参考文档:https://www.cnblogs.com/ericli-ericli/p/5917018.html 参考文档:RabbitMQ 实现RPC MQ的使用场景大概包括解耦,提高峰值处理能力 ...

  10. 基于netty实现rpc框架-spring boot客户端

    上篇讲了RPC服务端的实现.原理就是解析netty通道数据拿到类.方法及入参等信息,然后通过java反射机制调用本地接口返回结果.没有用到很复杂的技术. 这篇我们将客户端的实现.说白了客户端的任务很简 ...

随机推荐

  1. [转帖]TiDB 整体架构

    https://docs.pingcap.com/zh/tidb/stable/tidb-architecture 与传统的单机数据库相比,TiDB 具有以下优势: 纯分布式架构,拥有良好的扩展性,支 ...

  2. [转帖]linux中Shell日期转为时间戳的方法

    http://www.nndssk.com/xtwt/169617hFPRvq.html shell中获取时间戳的方式为:date -d "$currentTime" +%s $ ...

  3. [转帖]jumpserver (Linux资产管理快速入门)

    准备工作 准备三台虚拟机,一台作为jumpserver的服务端,两台作为测试端. 一.安装好jump server后,输入IP地址登录 [192.168.2.111为本机测试地址] 二.创建用户组 这 ...

  4. [转帖]009 Linux 文件大小统计与排序 (du 于 df 和 sort)

    https://my.oschina.net/u/3113381/blog/5463932 01 du 与 df 作用与区别? Linux 最有用最常用的统计文件大小命令是什么?无疑就是 du 和 d ...

  5. [转帖]Oracle入门精读28-字符集 AL32UTF8与UTF8

    字符(Character) 字符是各种文字和符号的总称,包括各国家文字.标点符号.图形符号.数字等. 字符编码(Character Encoding) 是一套法则,使用该法则能够对自然语言的字符的一个 ...

  6. 【小测试】玩一玩 VictoriaMetrics 的 force merge

    作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯 我是期望通过备份来建立 VictoriaMetrics 的 ...

  7. Spring WebSocket实现实时通信的详细教程

    简介 WebSocket 是基于TCP/IP协议,独立于HTTP协议的通信协议.WebSocket 连接允许客户端和服务器之间的全双工通信,以便任何一方都可以通过已建立的连接将数据推送到另一方. 我们 ...

  8. 【1】paddle飞桨框架高层API使用讲解

    1.高层API简介 飞桨框架2.0全新推出高层API,是对飞桨API的进一步封装与升级,提供了更加简洁易用的API,进一步提升了飞桨的易学易用性,并增强飞桨的功能. 飞桨高层API由五个模块组成:数据 ...

  9. 8.6 C++ 泛型化编程态

    C/C++语言是一种通用的编程语言,具有高效.灵活和可移植等特点.C语言主要用于系统编程,如操作系统.编译器.数据库等:C语言是C语言的扩展,增加了面向对象编程的特性,适用于大型软件系统.图形用户界面 ...

  10. 7.5 C/C++ 实现链表队列

    链表队列是一种基于链表实现的队列,相比于顺序队列而言,链表队列不需要预先申请固定大小的内存空间,可以根据需要动态申请和释放内存.在链表队列中,每个节点包含一个数据元素和一个指向下一个节点的指针,头节点 ...