Golang gRPC学习(05): retry重试
什么是重试
如果服务出现了错误,主要是网络,服务器出现了短暂异常的时候,该怎么办?
我们都会人工或者自动的重新连接服务试试,看服务是否恢复可用了。
这种重新进行连接服务的一种方式就是重试。如果是在微服务里,应该属于微服务治理的范畴。
重试是处理网络服务出现暂时不可用的一种方法。
怎么进行重试
第一:你要能知道网络出现了错误。
怎么才能知道网络出现了错误呢?
一种是你主动探测网络是否可用,比如说健康检查;一种是根据定义的错误码来进行重试。比如http的一些错误码。
第二:根据上面的探测或者错误码决定是否重试。
因为不是所有的错误都要进行重试,我们要根据具体情况来做决定是否重试。
第三:重试的策略
就是怎么进行重试。
在gRPC的这份设计中,主要有2中重试策略:
Retry Policy,出错时立即重试
Hedging Policy,定时发送并发的多个请求,根据请求的响应情况决定是否发送下一个同样的请求,还是返回(好像该策略目前未实现)
在Retry和Heading基础上的限流
客户端的重试策略和限流策略都是用一个配置文件配置 - service config,这个配置文件用proto定义了一些字段和格式,文件在 grpc/service_config/service_config.proto 中,它最终会解析为一个json格式,proto->json 规则文档。
一些Service Config文档例子:doc/service_config
例子
参考官方的例子把我们前面的hello word程序用retry策略改写下。
客户端
主要是要在 Dial() 建立连接的这个函数里加一个参数 grpc.WithDefaultServiceConfig() ,这个就是配置重试策略的参数。
conn, err := grpc.Dial(Address, grpc.WithInsecure(),grpc.WithDefaultServiceConfig(retryPolicy))
里面的参数 retryPolicy 是一个json的字符串,这个就是service config:
retryPolicy = `{
"methodConfig":[{
"name":[{"service": "grpc-tutorial.05retry.hello.hello"}],
"waitForReady": true,
"retryPolicy": {
"MaxAttempts": 4,
"InitialBakckoff": ".01s",
"MaxBackoff": ".01s",
"BackoffMultiplier": 1.0,
"RetryableStatusCodes": ["UNAVAILABLE"]
}
}]}`
- MaxAttempts:
最多请求次数。这里设置为4,一次原始请求,三次重试请求。
MaxAttempts必须是大于1的整数,对于大于5的值会被视为5。
- InitialBakckoff, BackoffMultiplier, MaxBackoff
这3个参数要结合看, 意思是在进行下一次重试请求前,会计算需要等待的时间,计算公式为:- 第一次重试间隔是
random(0, InitialBakckoff) - 第 n 次的重试间隔为
random(0, min( InitialBakckoff*BackoffMultiplier*(n-1) , MaxBackoff ))
- 第一次重试间隔是
InitialBakckoff 和 MaxBackoff 必须指定,并且必须具有大于0。
BackoffMultiplier 必须指定,并且大于零。
- RetryableStatusCodes
会根据这个RetryableStatusCodes来判断是否进行重试。这里设置为UNAVAILABLE,会根据这个状态来进行重试。
retryableStatusCodes 必须制定为状态码的数据,不能为空,并且没有状态码必须是有效的 gPRC 状态码,可以是整数形式,并且不区分大小写 ([14], [“UNAVAILABLE”], [“unavailable”)
服务端
在服务端我要制造重试的情况出来,主要是 failRequest() 这个函数,改写一下程序:
type failServer struct {
pb.UnimplementedHelloServer
mu sync.Mutex
reqNum uint
reqMax uint
}
func (f *failServer) failRequest() error {
f.mu.Lock()
defer f.mu.Unlock()
f.reqNum++
if (f.reqMax > 0) && (f.reqNum % f.reqMax == 0) {
return nil
}
return status.Errorf(codes.Unavailable, "failRequest: failing it")
}
然后在main函数初始化一下这个failServer struct:
failService := &failServer{
reqNum: 0,
reqMax: 4,
}
完整的例子在:这里github
运行看看:
先运行服务端:go run server/main.go
在运行客户端:GRPC_GO_RETRY=on go run client/main.go
注意:
运行客户端一定要在环境变量里加上 GRPC_GO_RETRY=on
可是报错了:
sayhello err: rpc error: code = Unavailable desc = failRequest: failing it
exit status 1
而且服务端也只打印了一条信息:
request failed num: 1
Golang gRPC学习(05): retry重试的更多相关文章
- Golang gRPC学习(04): Deadlines超时限制
为什么要使用Deadlines 当我们使用gRPC时,gRPC库关系的是连接,序列化,反序列化和超时执行.Deadlines 允许gRPC客户端设置自己等待多长时间来完成rpc操作,直到出现这个错误 ...
- golang——gRPC学习
1.获取gRPC 环境变量GOPATH的src目录下执行: git clone https://github.com/grpc/grpc-go.git google.golang.org/grpc g ...
- Golang gRPC学习(03): grpc官方示例程序route_guide简析
代码主要来源于grpc的官方examples代码: route_guide https://github.com/grpc/grpc-go/tree/master/examples/route_gui ...
- gRPC学习之三:初试GO版gRPC开发
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- gRPC学习
概述 gRPC 一开始由 google 开发,是一款语言中立.平台中立.开源的远程过程调用(RPC)系统. 在 gRPC 里客户端应用可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法, ...
- gRPC学习之一:在CentOS7部署和设置GO
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- gRPC学习之二:GO的gRPC开发环境准备
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos gRPC学习系列文章链接 在CentOS7部署和设置G ...
- gRPC学习之四:实战四类服务方法
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- gRPC学习之五:gRPC-Gateway实战
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- Golang 语法学习笔记
Golang 语法学习笔记 包.变量和函数. 包 每个 Go 程序都是由包组成的. 程序运行的入口是包 main. 包名与导入路径的最后一个目录一致."math/rand" 包由 ...
随机推荐
- [转帖]绕过CDN查看网站真实IP
https://www.itblogcn.com/article/viewcdnip.html 这是一个总结帖,查了一下关于这个问题的国内外大大小小的网站,对其中说的一些方法总结归纳形成. 首先, ...
- [转帖]记druid 连接池没满,但超时问题 GetConnectionTimeoutException active 5, maxActive 100
记druid 连接池没满,但超时问题 GetConnectionTimeoutException active 5, maxActive 100 问题说明 线上服务突然出现报错,通过日志查找发现是因为 ...
- [转帖]Kafka需要知道的一些基础知识点
https://blog.csdn.net/daima_caigou/article/details/109101405 前言 kafka是常用MQ的一种,站在使用者的角度来看待,kafka以及所有的 ...
- [转帖]调优"四剑客"的实战演练,福尔摩斯•K带你轻松优化性能
前言 天下武功,唯快不破.在侦探的世界中,破案效率永远是衡量一名侦探能力的不二法门.作为推理界冉冉升起的新星,大侦探福尔摩斯·K凭借着冷静的头脑.严谨的思维,为我们展现了一场场华丽而热血的推理盛宴. ...
- [转帖]gdb调试常见命令详细总结(附示例操作)
一.简介 通过gdb调试我们可以监控程序执行的每一个细节,包括变量的值.函数的调用过程.内存中数据.线程的调度等,从而发现隐藏的错误或者低效的代码,程序的调试过程主要有:单步执行,跳入函数,跳出函数, ...
- ACME笔记(思维导图)
作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯
- 4.6 C++ Boost 函数绑定回调库
Boost 库是一个由C/C++语言的开发者创建并更新维护的开源类库,其提供了许多功能强大的程序库和工具,用于开发高质量.可移植.高效的C应用程序.Boost库可以作为标准C库的后备,通常被称为准标准 ...
- M2版Mac mini被京东杀到史低2888元!比苹果官网低1600
苹果跳水王M2版Mac mini又降价了. 根据京东官方百亿补贴频道显示,Mac mini 8+256GB入门版只要2888元了,比前不久的拼多多2959还低,刷新了这款电脑的史上最低价. 对比官网原 ...
- Java执行Shell和传输文件
特性: 多线程批量执行 多密码尝试 引入依赖: <dependency> <groupId>ch.ethz.ganymed</groupId> <artifa ...
- 应用--WebApplication
应用--Program中的WebApplication 在6.0,微软团队对于NetCore做了很大的改变,其中有一个改变就是推出了新的托管模型--最小托管模型,使用该模型可以创建最小的web应用.( ...