Feign的不恰当的fallback

Feign的坑不少,特别与Hystrix集成之后。

在微服务引入Feign后,上线不久后便发现,对于一个简单的查询类调用,在下游返回正常的"404-资源不存在"这种业务异常时,Feign也做了fallback,最终导致circuit break,引发平台告警。

REST接口的设计

为了解释这个问题,首先还是要从REST接口开始谈起。

REST的一个缺点(也有人认为是优势),它只是一种依赖于HTTP的"风格",而没有明确的"规范",所以客户端和服务端之间,要自行达成某种"约定"。

例如返回码,就要硬往HTTP STATUS上靠。

关于返回码,公认的"最佳实践"大概是这样的:

  1. 如果业务处理成功,http status返回200、204等。如果有内容,BODY中直接返回内容(对象或数组都可以),不再有RPC时代的code/message这样的状态描述。如果没有内容,BODY直接空白,No News Is Good News。
  2. 如果业务处理失败,业务逻辑导致的,则http status返回4XX,BODY中返回报错信息,报错信息的统一格式大概是这样的:
{
"status": 409, // 冗余字段,把http status再重复一遍
"code": 888, // 自定义的错误码
"message": "foobar" // 错误描述
}
  1. 如果是其它未知错误,抛5XX,认为是服务器内部错误,而不是逻辑错误。

所以对于APP/WEB等客户端来说,很简单,如果发现2XX,则认为成功,直接获取数据。如果非2XX,则是失败,直接取code和message,展现到前台。

但是对于微服务之间的调用,就要区分是"4XX-业务逻辑异常",还是"5XX-服务器异常"了。。。

REST返回码的选择

下面详细讲一下HTTP STATUS的选择问题。

关于HTTP返回码,看了很多参考(论战),"大概"可以这样选择:

成功: 2XX系列

  • 200 OK // 查询、删除成功用这个
  • 201 CREATED // 新增、修改时用这个。且返回BODY中无任何信息。

业务异常: 4XX系列

  • 400 BAD_REQUEST // 现在有很多人在业务异常时抛这个错。但400要慎重使用。稍后解释。
  • 404 NOT_FOUND // 查询不到结果时用这个
  • 403 FORBIDDEN // 这个也慎重使用。
  • 409 CONFLICT // 业务异常时,可以用这个。

主机异常:5XX系列

  • 500 INTERNAL_SERVER_ERROR // 对于未知异常,统一用这个了
  • 503 SERVICE_UNAVAILABLE // Hystrix异常用这个

什么时候应该Fallback

2XX,成功,这个不用再讨论。

5XX,也相当明确,直接Fallback,这个也不用讨论。

4XX,可以一律认为是业务逻辑异常(或者更精确的说,可以认为4XX中的某几个是业务异常)。这时候,应该是用if/else来处理这个异常,而不应该动用Hystrix来Fallback。

Feign在默认情况下,对于非2XX,都认为是异常。这个地方是有问题的。特别是对于404这种非常容易抛出的业务异常来说,没两下就circuit break了。

Feign的Issue里已经有人提过这个问题,后面的版本中已经提供了一个参数:decode404

可以看一下Feign的代码,位置在:

~/.m2/repository/io/github/openfeign/feign-core/9.5.0/feign-core-9.5.0.jar!/feign/SynchronousMethodHandler.class

 
 

所以在Client上可以这样设置:

@FeignClient(name = "marathon-lb", fallback = FooBarClientFallback.class, decode404 = true)
@RequestMapping(value = "/foo/bar")
public interface FooBarClient {
... ...
}

只需要加入decode404 = true这一个参数,Feign对于2XX和404 ,都不会走Fallback了。

排除404,已经基本上够用了,如果想把409、400等status也加到例外中,可以重写一下Feign的errorDecoder。

关于4XX错误

刚才提到的,如果把2XX,另外加上4XX,全部认为是正常业务逻辑,都不走Fallback,可不可行? 我想最好不要这样很笼统的设置,要看情况。

因为http status不全是服务端给出的,如果服务端与消费者之间隔着一些Nginx、HA、Kong这样的网关,那么情况可能就复杂了,网关也有可能抛出status。

例如当某个微服务宕机之后,Kong网关会直接返回400,这种情况下,很明显是应当Fallback的。

所以,在定义错误码时,要尽量避开400、403这种很溃常见的码,像409这样小众的,差不多可以放心使用。

这样,调用方就可以有针对性的对某几个4XX的status进行单独配置,配置为业务异常。

作者:bluexiii
链接:https://www.jianshu.com/p/8d47a4fc4e82
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

关于Feign的Fallback处理的更多相关文章

  1. SpringCloud Feign 之 Fallback初体验

    SpringCloud Feign 之 Fallback初体验 在微服务框架SpringCloud中,Feign是其中非常重要且常用的组件.Feign是声明式,模板化的HTTP客户端,可以帮助我们更方 ...

  2. feign的fallback操作

    Fallback可以帮助我们在使用Feign去调用另外一个服务时,如果出现了问题,走服务降级,返回一个错误数据,避免功能因为一个服务出现问题,全部失效. 依赖: <dependency> ...

  3. No fallback instance of type class found for feign client user-service(转)

    1.错误日志 在 feign 开启熔断,配置 fallback 类,实现当前接口的实现类时,报错信息如下: Error starting ApplicationContext. To display ...

  4. Feign使用Hystrix

    Feign使用Hystrix开发步骤 1.导入依赖spring-cloud-starter-hystrix 2.消费启动类开启@EnableCircuitBreaker 3.配置yml文件feign. ...

  5. springcloud(七) feign + Hystrix 整合 、

    之前几章演示的熔断,降级 都是 RestTemplate + Ribbon 和 RestTemplate + Hystrix  ,但是在实际开发并不是这样,实际开发中都是 Feign 远程接口调用. ...

  6. SpringCloud系列十六:Feign使用Hystrix

    1. 回顾 上文讲解了使用注解@HystrixCommand的fallbackMethod属性实现回退.然而,Feign是以接口形式工作的, 它没有方法体,前文讲解的方式显然不适用与Feign. 事实 ...

  7. SpringCloud Feign 之 超时重试次数探究

    SpringCloud Feign 之 超时重试次数探究 上篇文章,我们对Feign的fallback有一个初步的体验,在这里我们回顾一下,Fallback主要是用来解决依赖的服务不可用或者调用服务失 ...

  8. feign使用hystrix熔断的配置

    熔断器hystrix 在分布式系统中,每个服务都可能会调用很多其他服务,被调用的那些服务就是依赖服务,有的时候某些依赖服务出现故障也是很正常的. Hystrix 可以让我们在分布式系统中对服务间的调用 ...

  9. spring boot2X整合nacos一使用Feign实现服务调用

    服务调用有两种方式: A.使用RestTemplate 进行服务调用 查看 B.使用Feign 进行声明式服务调用 上一次写了使用RestTemplate的方式,这次使用Feign的方式实现 服务注册 ...

随机推荐

  1. Python小白的数学建模课-03.线性规划

    线性规划是很多数模培训讲的第一个算法,算法很简单,思想很深刻. 要通过线性规划问题,理解如何学习数学建模.如何选择编程算法. 『Python小白的数学建模课 @ Youcans』带你从数模小白成为国赛 ...

  2. 高频访问SQLite数据库

    SQLite 是一款开源的 SQL 数据库引擎,由于其自包含.无服务.零配置和友好的使用许可(完全免费)等特点,在桌面和移动平台被广泛使用. 在应用开发过程中,如果想保存点数据,自然而然地就会想到 S ...

  3. TensorFlow用法

    TensorFlow用法 什么是TensorFlow TensorFlow是一个开源软件库,用于使用数据流图进行数值计算.图中的节点表示数学运算,而图的边缘表示流动的多维数据数组(张量).这种灵活的体 ...

  4. 利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力

    利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力 Accelerating DSP Design Productivity with UltraScale an ...

  5. 软件工具将GPU代码迁移到fpga以用于AI应用

    软件工具将GPU代码迁移到fpga以用于AI应用 Software tools migrate GPU code to FPGAs for AI applications 人工智能软件初创公司Mips ...

  6. java 全端开源 电商系统 springboot uniapp 小程序 前后端分离 高可用

    Lilishop B2B2C商城系统 官方公众号 & 开源不易,如有帮助请点Star 所有jar包均可从maven中央仓库下载,无二次封装jar包,全端开源,无后门,无监控. 介绍 官网:ht ...

  7. 72 个网络应用安全实操要点,全方位保护 Web 应用的安全

    原文地址:Web Application Security Checklist 原文作者:Teo Selenius(已授权) 译者 & 校正:HelloGitHub-小熊熊 & 卤蛋 ...

  8. 解决redis集群版本不一致导致RDB同步失败的问题

    某天,运维反馈某两个机房的出口流量和入口流量过大,并且持续了好一段时间. 再仔细排查后发现是 redis 集群的几台服流量问题,于是开始查日志. 在日志中发现出现大量的 Can't handle RD ...

  9. SpringAOP 原理解析

    什么是AOP? 1: 传统的OOP编程他的代码逻辑是一种自上向下, 而在这些自上而下的过程中会产生一些横切性的问题,比如说:日志信息,权限校验认证,事务等, 2: 这些横切性问题,往往与我们的主业务逻 ...

  10. 认真总结Vue3中ref与reactive区别和isRef与isReactive 类型判断

    1.什么是ref? 1.ref和reactive-样 也是用来实现响应式数据的方法 由于reactive必须传递一个对象, 所以导致在企业开发中如果我们只想让某个变量实现响应式的时候会非常麻烦 所以V ...