聊聊Grpc使用中的坑以及怎么填
总所周知,随着云技术的发展,和业务的复杂度的上升,越来越多的系统开始拆分成独立的子模块微服务。模块之间免不了相互通信。但是随着业务量的增多,传输量也随之增大,偶发性timeout,无响应, 传输量过大等问题。
这时候就要对服务进行配置需要进行调优。可以从运维层面,或者代码层面,本文主要介绍从代码层面
Grpc是一个很好的微服务框架,大部分语言都支持,之前的文章有介绍,可以看一下。
这次主要说一下在Grpc微服务通信间的一些问题及优化。运维层面我们就不说了,主要是代码层面的优化。主要是C#代码,其他语言可参考,Grpc框架都大差不差

问题一:
Docker Swarm 模式下 服务闲置一段时间,客户端第一次连接会提示异常。咱公网是k8s部署,不清楚为什么k8s不会出现这个问题。
后来,通过查资料,可以大致知道是这么个流程。首先 kube-proxy 是支持 IPTABLES 和 IPVS 两种模式的,
使用的是 IPTABLES不会出现问题。具体为啥,没做深入连接,运维层面,我们就不吹牛逼。各位看官有兴趣去查一下,告诉小弟。
Grpc.Core.RpcException: Status(StatusCode=Unavailable, Detail="Connection reset by peer")
at System.Runtime.ExceptionServices.ExceptionDispatchInfo.Throw()
at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task)
at Grpc.Core.Internal.AsyncCall`.UnaryCall(TRequest msg)
at Grpc.Core.DefaultCallInvoker.BlockingUnaryCall[TRequest,TResponse](Method` method, String host, CallOptions options, TRequest request)
at Grpc.Core.Interceptors.InterceptingCallInvoker.<BlockingUnaryCall>b__3_0[TRequest,TResponse](TRequest req, ClientInterceptorContext` ctx)
at Grpc.Core.ClientBase.ClientBaseConfiguration.ClientBaseConfigurationInterceptor.BlockingUnaryCall[TRequest,TResponse](TRequest request, ClientInterceptorContext` context, BlockingUnaryCallContinuation` continuation)
解决方案:
1、重试机制
.net 可通过polly 实现,当然,这种方式不太好,毕竟不算根本上解决问题。只能算取巧。可以用第二种,从根本上解决唤醒问题
private readonly Polly.Retry.RetryPolicy RetryPolicy = Policy
.Handle<RpcException>(t => t.Status.StatusCode == StatusCode.Unavailable)
.Retry();
2、还可以通过优化Grpc 服务端代码,新增如下配置即可
var server = new Server(new List<ChannelOption>
{
new ChannelOption("grpc.keepalive_time_ms", ), // 发送 keepalive 探测消息的频度
new ChannelOption("grpc.keepalive_timeout_ms", ), // keepalive 探测应答超时时间
new ChannelOption("grpc.keepalive_permit_without_calls", ) // 是否允许在没有任何调用时发送 keepalive
})
{
Services = { ServiceA },
Ports = { new ServerPort(host, port, ServerCredentials.Insecure) },
};
问题二:
Grpc传输量,默认是4M,如果服务之间调用,传输数据量超过最大值,会提示 , Received message larger than max (xxxxxx vs. 4194304
解决方案:
1、我们通过代码配置,调大这个限制。以提高服务间吞吐量。
当然,不建议太大,太大了对服务资源也是一种消耗。可以通过第二种方式进行优化
var channelOptions = new List<ChannelOption>();
// add max message length option 设最大接收数量
channelOptions.Add(new ChannelOption(ChannelOptions.MaxReceiveMessageLength, ( * * ) * ))
2、通过Grpc流式调用
Grpc 是基于 HTTP/2 实现的,HTTP/2 具有流的概念,流是为了实现 HTTP/2 的多路复用。流是服务器和客户端在 HTTP/2 连接内用于交换帧数据的独立双向序列,逻辑上可看做一个较为完整的交互处理单元,即表达一次完整的资源请求、响应数据交换流程。
|
类型 |
说明 |
|
简单 RPC |
客户端传入一个请求对象,服务端返回一个结果对象 |
|
客户端流式 RPC |
客户端传入多个请求对象,服务端返回一个结果对象 |
|
服务端流式 RPC |
客户端传入一个请求对象,服务端返回多个结果对象 |
|
双向流式 RPC |
客户端传入多个请求对象,服务端返回多个结果对象 |
具体可以用法看一下官方文档,后面出一篇文章详细说一下流式调用,各位大侠敬请期待
如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!
本文版权归作者和博客园共有,来源网址:https://www.cnblogs.com/DanielYao/欢迎各位转载,但是未经作者本人同意,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。
聊聊Grpc使用中的坑以及怎么填的更多相关文章
- 从构建分布式秒杀系统聊聊Lock锁使用中的坑
前言 在单体架构的秒杀活动中,为了减轻DB层的压力,这里我们采用了Lock锁来实现秒杀用户排队抢购.然而很不幸的是尽管使用了锁,但是测试过程中仍然会超卖,执行了N多次发现依然有问题.输出一下代码吧,可 ...
- 文艺splay,占坑等着填
昨天CF上去就A了前三道题,然后自闭罚坐一个小时什么也没写出来23333.似乎D题人均wa3发就很烦.还是肤浅了 今天精神状态不太好,可能是晚睡的缘故,那不如明天一起写了算了 蹲一波大选结果,蹲一波s ...
- 浅谈Gson和fastjson使用中的坑
相信大家在代码编写中都用过Gson和fastjson吧,用来进行 Java对象和json字符串之间的转换. 本篇文章就主要介绍博主在工作中使用这两款工具时遇到的坑和对应的解决办法. 觉得有用的可以点个 ...
- 数据统计 任务的一点感想 , sql 使用中的坑。
需求: 多张表(个数不定,需求不是非常明确,只有一个大致需求)根据业务需求统计出一些数据 (按天统计,数据有多条校验规则)进行上传. 注意: 校验数据是否正确是需要第三放来反馈的,而且第三方的测试环境 ...
- React-Native 使用中的坑
android 1.键盘会在 ScrollView 之上----不知道是不是未给ScrollView 设置高度的问题 2.navigation的标题在android居中显示办法 navigationO ...
- 微信JSApi支付~坑和如何填坑
返回目录 微信一直用着不爽,这几天研究它的jsapi支付,即在微信内打开H5页面,完成支付的过程,在这个过程中,你将会遇到各种各样的问题,而大叔将把这些问题的解决方法写一下,希望可以给你带来帮助! 一 ...
- BigDecimal使用中的坑
1.BigeDecimal调用divide时一定要记得规定小数位数的保留情况,不然除不尽的时候报错. 2.使用该种BigeDecimal时,加减乘除都要使用它内部封装好的方法,不然容易报错.
- JavaScript之周道长浅谈变量使用中的坑
天空一声巨响,道长闪亮登场,飞花落叶,尘土飞扬,此处不应恐慌,用阅读变量的概念来提升气场. 1)变量的声明,使用一个变量之前应该先声明.变量是使用关键字var来声明的,如下: var number; ...
- 关于MySQL redo log,挖些坑,慢慢填
1. 为什么可以设置为多个redo log ? (innodb_log_files_in_group,默认值和推荐值都是2,我们线上设的统一为4): 2. 什么条件下会触发刷脏?除了master_th ...
随机推荐
- pytorch GPU训练好的模型使用CPU加载
torch.load('tensors.pt') # 把所有的张量加载到CPU中 torch.load('tensors.pt', map_location=lambda storage, loc: ...
- Pytorch手写线性回归
pytorch手写线性回归 import torch import matplotlib.pyplot as plt from matplotlib.animation import FuncAnim ...
- Python操作MySQL之查看、增删改、自增ID
在python中用pymysql模块来对mysql进行操作,该模块本质就是一个套接字客户端软件,使用前需要事先安装,在cmd中输入: pip3 install pymysql 1.查看 import ...
- Task Scheduler API Error 80041318
https://stackoverflow.com/questions/42307917/task-scheduler-api-error-80041318/42462235#42462235 Hi ...
- [Qt] 打开文件夹 Windows
bool ok = QDesktopServices::openUrl(QUrl("c:/users/administrator/desktop/dir"));
- HDU 5416 CBR and tree
#include<bits/stdc++.h> using namespace std; #define for(i,a,b) for(int i=a;i<=b;++i) //T,N ...
- java 之 构造器 static关键字
构造器 特点: 方法名和类名一至,没有void没有返回,无参数的称为无参构造器,有参数的称为有参构造器 语法: public 类名 {数据类型 参数名} 目的:创建对象 注意:如果类中没有带有参数的 ...
- 数据之路 - Python爬虫 - 动态页面
一.Ajax数据爬取 1.Ajax介绍 Ajax,全称为Asynchronous JavaScript and XML,即异步的JavaScript和XML. 它不是一门编程语言,而是利用JavaSc ...
- windows服务程序的编写
服务编写https://blog.csdn.net/lanuage/article/details/77937407 #include <windows.h> #include <s ...
- ES6中Fetch的封装及使用,炒鸡简单~
之前写过一篇<ajax.axios.fetch之间的详细区别以及优缺点> 戳这里 1.封装 (http.js) class Ajax { get(url) { return new Pro ...