引言

现在的大中型应用,很多都在朝着服务化、分布式的方向发展。这有多方面的考虑,比如说,方便治理、便于扩展、服务隔离等等。不过在带来如此多利好的同时,不可避免的也会带来麻烦,比如系统架构复杂、服务依赖关系繁杂。整体来说,还是利大于弊,而我们需要思考的,就是怎么在得到这些利的同时,解决弊端。从本篇开始,将会用两到三篇来探讨这方面的心得。

正文

这类应用,往往会依赖几个甚至几十个服务,而服务发生故障又是不可避免的事情,即使你说自己的服务达到了四个9的高标准,那么借用网上的一个算式,如果应用A依赖了30个服务,那么出错的几率也是99.99%^30=99.70%每年大约有24个小时是不稳定的。一亿次请求*0.3%=30w次失败。有没有细思极恐的赶脚?

很多时候,我们还不得不面临,只有一个服务延迟或者挂掉,结果整个应用都受到影响。在高QPS的场景下,很快整个服务器上的资源就会被耗尽。来个图感受下(注:图片来自于网络):

服务I出问题,站在其他服务的角度看,这就是坑队友了啊。如果再有级联的依赖,简直就是噩梦。

那么怎么办呢?继续提升每个服务的可用率?当然,这是我们永远的追求,如星辰大海一般,没有止境。但也正是因此认识到,想达到100%的可用率,几乎不可能,只要有那么点缺憾的存在,那么,一旦量级起来了,刺耳的报警短信之音还是会在夜深人静的时候响起。

既然这条路走不通,或者说只能部分走通,那么还有没有其他路呢?当然有,办法总比问题多。

最常用的就是降级策略。所谓降级,无非就是愿意承担一定限度的成本,保证整体可用。举几个例子来说:

    • 牺牲一小部分流量(其实深究起来就是用户的请求),来保证服务整体不被压垮。

    • 不再强求一小部分服务的返回值,保证绝大多数服务可用。

    • 当然还有缓存,牺牲数据的时效性,保证可用性。

方向性的指导原则有了,不会南辕北辙了,那么剩下的就是具体实践了,正所谓工欲善其事必先利其器。本篇,将重点研究业界流行的一件神兵利器:Hystrix。

Hystrix是通过什么手段来实现的服务降级呢?在小端看来,最核心的就是以下三点,其他的都是锦上添花的东西:

    1. 配置线程池,来控制并发量

    2. 配置超时时间,加快返回速度

    3. 配置熔断器,直接拒绝请求(舍小我保大家)

下面,详细说明:

隔离:

为每一个服务,注意,是每一个,都维护一个独立的线程池(或者信号量),当线程池满时,使用相应策略处理,比如拒绝服务,比如排队(要看配置的是哪种线程池了)。这样,就控制了并发量。不会因为突然而至的请求骤增,压垮服务。这样就实现了服务间相互隔离,彼此不受影响的效果。如下图(图片来自网络):

命令模式:

这个真没什么高深的,就是我们的业务逻辑类,要继承HystrixCommand或者HystrixObservableCommand,重写他们的run()或construct()方法。在该方法里,实现对外部服务的调用。而在使用时,就像下命令一样,对业务逻辑类实例化的对象,下达“命令”(即调用提供的统一的execute、queue等方法),而不需关心内部的具体调用逻辑,即可自动执行我们重写的run()或者construct()。

超时:

设置超时时间,那么在每个请求执行过程中,一旦发生响应超时,即可有所动作,对的,就是转而去执行getFallBack()方法,快速返回结果,释放系统资源。当然,执行失败的,也是如此处置。

熔断器:

这个词看起来高大上,知道这个词,是前几年A股里的那次事件。在这里思路其实差不多,就是我要统计一个时间窗口内,服务的成功、失败、超时等的数据,然后依据配置的策略,比如失败率达到80%时,切断服务一段时间,这时,任何请求,都拒绝服务!拒绝服务!拒绝服务!直接执行getFallBack()逻辑。比较牛的设计是,提供了自动恢复能力。可以配置一个时间阈值,在拒绝服务超过这个时长后,接受一个请求,尝试调用服务。如果成功,则服务恢复,如果失败,则继续进入熔断状态。

下篇预告

基本原理性的东西,先写这么多,下篇继续从使用层面分析。

如果对你有帮助,可以关注我的公众号,第一时间看到更多原创内容:

搜索:小端有话说

扫码:

服务治理利器Hystrix-理论篇的更多相关文章

  1. 14 微服务电商【黑马乐优商城】:day02-springcloud(理论篇一:HttpClient的简单使用)

    本项目的笔记和资料的Download,请点击这一句话自行获取. day01-springboot(理论篇) :day01-springboot(实践篇) day02-springcloud(理论篇一: ...

  2. 14 微服务电商【黑马乐优商城】:day02-springcloud(理论篇四:配置Robbin负载均衡)

    本项目的笔记和资料的Download,请点击这一句话自行获取. day01-springboot(理论篇) :day01-springboot(实践篇) day02-springcloud(理论篇一) ...

  3. ASP.NET CORE 使用Consul实现服务治理与健康检查(2)——源码篇

    题外话 笔者有个习惯,就是在接触新的东西时,一定要先搞清楚新事物的基本概念和背景,对之有个相对全面的了解之后再开始进入实际的编码,这样做最主要的原因是尽量避免由于对新事物的认知误区导致更大的缺陷,Bu ...

  4. ASP.NET CORE 使用Consul实现服务治理与健康检查(1)——概念篇

    背景 笔者所在的公司正在进行微服务改造,这其中服务治理组件是必不可少的组件之一,在一番讨论之后,最终决定放弃 Zookeeper 而采用 Consul 作为服务治理框架基础组件.主要原因是 Consu ...

  5. 14 微服务电商【黑马乐优商城】:day01-springboot(理论篇)

    本项目的笔记和资料的Download,请点击这一句话自行获取. day01-springboot(理论篇) :day01-springboot(实践篇) :day01-springboot(Thyme ...

  6. 14 微服务电商【黑马乐优商城】:day02-springcloud(理论篇二:知道什么是SpringCloud)

    本项目的笔记和资料的Download,请点击这一句话自行获取. day01-springboot(理论篇) :day01-springboot(实践篇) day02-springcloud(理论篇一: ...

  7. Spring Cloud(四):服务容错保护 Hystrix【Finchley 版】

    Spring Cloud(四):服务容错保护 Hystrix[Finchley 版]  发表于 2018-04-15 |  更新于 2018-05-07 |  分布式系统中经常会出现某个基础服务不可用 ...

  8. 【Dalston】【第一章】 服务治理(Eureka)

    Spring Cloud是一系列框架的集合,其基于Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,构建了服务治理(发现注册).配置中心.消息总线.负载均衡.断路器.数据监控.分 ...

  9. SQL Server ->> 高可用与灾难恢复(HADR)技术 -- AlwaysOn可用性组(理论篇)

    因为篇幅原因,AlwaysOn可用性组被拆成了两部分:理论部分和实战部分.而实战部分又被拆成了准备工作和AlwaysOn可用性组搭建. 三篇文章各自的链接: SQL Server ->> ...

随机推荐

  1. 面向对象编程(OOP)的五大特征-java学习之旅(1)

    这是Alan Kay关于第一个成功的面向对象语言SmallTalk的总结: 1.所有的东西都是对象.可将对象想象成一种新型的变量:它保存着数据,但是可要求它对自身进行操作,理论上讲,可从要解决的问题身 ...

  2. jenkins新建slave

    (1)linux-ssh方式 请确保slave账户的java为1.6版本,其中1.3.4.6.7.8.9为必填项. (2)windows-jnlp方式 (1)与ssh方式不同,windows节点请先在 ...

  3. PorterDuffXferMode不正确的真正原因PorterDuffXferMode深入试验)

    菜鸡wing遇敌PorterDuffXferMode,不料过于轻敌,应战吃力.随后与其大战三天三夜,三百余回合不分胜负.幸得 @咪咪控 相助,侥幸获胜. 关键字:PorterDuffXferMode ...

  4. linux知识汇总

    1.     利用Ctrl+Alt+F1到Ctrl+Alt+F6在6个虚拟控制台之间切换,利用Ctrl+Alt+F7切换回图形界面. 2.     使用who命令来判断谁在系统上及其登录方式.id命令 ...

  5. EasyUI中tree,Datagrid,pagenation的使用EasyUI中Datagrid和pagenation进行关联时,再次点击pagenation时让表格数据显示的问题

    // 获取选中一行的情况,下面的一个参数可以代表一个DataGridfunction getSelected(dialogEle,dataFileTextEle) { // 获取选中一行的情况. va ...

  6. 【数值分析】误差的分析与减少及Matlab解线性方程的四种方法

    1.误差的来源 模型误差:数学模型与实际问题之间的误差 观测误差:测量数据与实际数据的误差 方法误差:数学模型的精确解与数值方法得到的数值解之间的误差:例如 舍入误差:对数据进行四舍五入后产生的误差 ...

  7. TCP的核心系列 — SACK和DSACK的实现(六)

    上篇文章中我们主要说明如何skip到一个SACK块对应的开始段,如何walk这个SACK块包含的段,而没有涉及到 如何标志一个段的记分牌.37版本把给一个段打标志的内容独立出来,这就是tcp_sack ...

  8. C/C++语言中NULL、'\0’和0的区别

    注:本文参考了http://blog.csdn.net/mylinx/article/details/6873253及书籍<征服C指针>([日]前桥和弥著). NULL.'\0'和0的值是 ...

  9. 使IFRAME在iOS设备上支持滚动

    原文链接: Scroll IFRAMEs on iOS原文日期: 2014年07月02日 翻译日期: 2014年07月10日翻译人员: 铁锚很长时间以来, iOS设备上Safari中超出边界的元素将不 ...

  10. Linux变量内容的删除、取代与替换

    变量内容的删除与取代 范例一:先让小写的 path 自定义变量配置的与 PATH 内容相同 [root@www ~]# path=${PATH} [root@www ~]# echo $path /u ...