序言

感觉hystrix很精彩,文档讲的也很好，这篇总结到哪里是哪里吧

写Hystrix之前，我们先简单的说说熔断器，和限流，这样你看完之后，就可以很容易理解Hystrix

熔断器

熔断器模式源于Martin Fowler的Circuit Breaker一文。“熔断器”本身是一种开关装置，用于在电路上保护线路过载，当线路中有电器发生短路时，“熔断器”能够及时的切断故障电路，防止发生过载、发热、甚至起火等严重后果。

熔断器设计中有三种状态，生生世世，循环往复。

closed（关闭状态，流量可以正常进入）
open（即熔断状态，一旦错误达到阈值，熔断器将打开，拒绝所有流量）
half-open(半开状态，open状态持续一段时间后将自动进入该状态，重新接收流量，一旦请求失败，重新进入open状态，但如果成功数量达到阈值，将进入closed状态)

整体流程见下图：

CLOSED关闭状态：允许流量通过。

OPEN打开状态：不允许流量通过，即处于降级状态，走降级逻辑。

HALF_OPEN半开状态：允许某些流量通过，并关注这些流量的结果，如果出现超时、异常等情况，将进入OPEN状态，如果成功，那么将进入CLOSED状态。

在分布式架构中，熔断器模式的作用也是类似的，当某个服务单元发生故障（类似用电器发生短路）之后，通过断路器的故障监控（类似熔断保险丝），向调用方返回一个错误响应，而不是长时间的等待。这样就不会使得线程因调用故障服务被长时间占用不释放，避免了故障在分布式系统中的蔓延。

限流

在开发高并发系统时，有很多手段保护系统，比如缓存、降级和限流。缓存的目的是提升系统访问速度和增大系统处理能力，可谓是抗高并发的银弹。而降级是当服务出问题或者影响到核心流程的性能，需要暂时屏蔽掉，待高峰过去或者问题解决后再打开的场景。而有些场景并不能用缓存和降级来解决，比如稀缺资源（秒杀、抢购）、写服务（如评论、下单）、频繁的复杂查询（评论的最后几页）等。因此，需要有一种手段来限制这些场景下的并发/请求量，这种手段就是限流。

限流的目的是通过对并发访问/请求进行限速或者一个时间窗口内的请求进行限速来保护系统，一旦达到限速速率则可以拒绝服务（定向到错误页或告知资源没有了）、排队或等待（比如秒杀、评论、下单）、降级（返回兜底数据或者默认数据，如商品详情页库存默认有货）。在压测时，我们能找出每个系统的处理峰值，然后通过设定峰值阈值，当系统过载时，通过拒绝过载的请求来保障系统可用。另外，也可以根据系统的吞吐量、响应时间、可用率来动态调整限流阈值。

一般开发高并发系统场景的限流有：限制总并发数（比如数据库连接池、线程池）、限制瞬时并发数（如Nginx的limit_conn模块，用来限制瞬间并发连接数）、限制时间窗口内的平均速率（如Guava的RateLimiter、Nginx的limit_req模块，用来限制每秒的平均速率），以及限制远程接口调用速率、限制MQ的消费速率等。另外还可以根据网络连接数、网络流量、CPU或内存负载等来限流。

限流算法

常见的限流算法有：令牌桶、漏桶。计数器也可以用来进行粗暴限流实现。

令牌桶算法

令牌桶算法，是一个存放固定容量令牌的桶，按照固定速率往桶里添加令牌。令牌桶算法的描述如下：

假设限制2r/s，则按照500毫秒的固定速率往桶内添加令牌。
桶中最多存放b个令牌，当桶满时，新添加的令牌会被丢弃或拒绝。
当一个n个字节大小的数据包到达，将从桶中删除n个令牌，接着数据包被发送到网络上。
如果桶中的令牌不足n个，则不会删除令牌，且该数据包被限流（要么丢弃，要么在缓冲区等待）。

漏桶算法

漏桶作为计量工具时，可以用于流量整形和流量控制，漏桶算法的描述如下：

一个固定容量的漏桶，按照常量固定速率流出水滴。
如果桶是空的，则不需流出水滴。
可以以任意速率流入水滴到漏桶。
如果流入水滴超过了桶的容量，则流入的水滴溢出了（被丢弃），而漏桶容量是不变的。

常见的限流方式有：限制总并发数（数据库连接池、线程池）、限制瞬时并发数（如Nginx的limit_conn模块）、限制时间窗口的平均速率（如Guava的RateLimiter、Nginx的limit_req模块）、限制远程接口的调用速率、限制MQ的消费速率等。从应用的层面上来讲，又可以分为：接入层限流、应用层限流和分布式限流等。

Hystrix是什么

这一节方便阅读，我都抄下来来，具体看文档Hystrix：https://github.com/Netflix/Hystrix/wiki

在分布式环境中，许多服务依赖项中的一些不可避免地会失败。Hystrix是一个库，可通过添加延迟容错和容错逻辑来帮助您控制这些分布式服务之间的交互。Hystrix通过隔离服务之间的访问点，阻止它们之间的级联故障以及提供后备选项来实现这一目标，所有这些都可以提高系统的整体弹性。

Hystrix旨在执行以下操作：

通过第三方客户端库访问（通常通过网络）依赖关系，以防止和控制延迟和故障。
在复杂的分布式系统中停止级联故障。
快速失败并迅速恢复。
在可能的情况下，后退并优雅地降级。
实现近实时监控，警报和操作控制。

复杂分布式体系结构中的应用程序有许多依赖项，每个依赖项在某些时候都不可避免地会失败。如果主机应用程序没有与这些外部故障隔离，那么它有可能被他们拖垮。

例如，对于一个依赖于30个服务的应用程序，每个服务都有99.99%的正常运行时间，你可以期望如下：

99.99³⁰= 99.7% 可用

也就是说一亿个请求的0.03% = 3000000 会失败

如果一切正常，那么每个月有2个小时服务是不可用的

现实通常是更糟糕

当一切正常时，请求看起来是这样的：

当其中有一个系统有延迟时，它可能阻塞整个用户请求：

在高流量的情况下，一个后端依赖项的延迟可能导致所有服务器上的所有资源在数秒内饱和（PS：意味着后续再有请求将无法立即提供服务）

当您使用Hystrix来包装每个底层依赖项时，上图中显示的体系结构将更改为类似于下图。每个依赖项彼此隔离，在发生延迟时可以饱和的资源受到限制，并且在回退逻辑中涵盖，该逻辑决定了在依赖项中发生任何类型的故障时要做出的响应：

Feign调用使用Hystrix示例

首先，前几节的环境，都有啊，没有或需要的去看我前几篇文章吧

pom.xml

 <dependency>

            <groupId>org.springframework.cloud</groupId>

            <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>

        </dependency>

feign调用接口

@FeignClient(name = "trade-promotion", fallback = PromotionClientFallback.class)

public interface PromotionClient {

    @RequestMapping(value = "/Promotion/delete", method = RequestMethod.GET)

    String releasePromotion(@RequestParam int orderID);

}

fallback类

@Component

public class PromotionClientFallback implements PromotionClient {

    @Override

    public String releasePromotion(@RequestParam int orderID) {

        return "hello ,fallback !";

    }

}

调用

@RestController

@RequestMapping(value = "/promotion", method = RequestMethod.GET)

public class PromotionController {

    @Autowired

    PromotionClient promotionClient;

    @RequestMapping(value = "/delete")

    public String delete(@RequestParam int orderID) {

        return promotionClient.releasePromotion(orderID);

    }

}

配置文件

#hystrix

feign.hystrix.enabled=true

好啦,可以啦.说下,就是如果远程调用接口异常,会执行Fallback返回 "hello ,fallback !";

如果你想知道为什么失败,失败的原因

@Component

public class PromotionClientFallbackFactory implements FallbackFactory<PromotionClient> {

    @Override

    public PromotionClient create(Throwable cause) {

        return new PromotionClient() {

            @Override

            public String releasePromotion(int orderID) {

                return "fallback:orderid=" + orderID + "，message:" + cause.getMessage();

            }

        };

    }

}

@FeignClient(name = "trade-promotion", fallbackFactory = PromotionClientFallbackFactory.class)

public interface PromotionClient {

    @RequestMapping(value = "/Promotion/delete", method = RequestMethod.GET)

    String releasePromotion(@RequestParam int orderID);

}

这样也可以

  @HystrixCommand(fallbackMethod = "error")

    public String search(@RequestParam int id) {

        try {

            Thread.sleep(10000);

            return id + "";

        }

        catch (Exception ex)

        {

            return ex.getMessage();

        }

    }

    public String error(int id)

    {

        return  "error"+id;

    }

好啦,这样就ok啦.

Hystrix配置

#hystrix

feign.hystrix.enabled=true

#是否开启fallback功能，默认为true

hystrix.command.default.fallback.enabled=true

#开启hystrix请求超时机制 也可以设置成永久不超时

hystrix.command.default.execution.timeout.enabled=true

#设置调用者执行的超时时间（单位毫秒），默认：1000

hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=10000

#此属性设置从调用线程允许HystrixCommand.getFallback（）方法允许的最大并发请求数

#如果达到最大的并发量，则接下来的请求会被拒绝并且抛出异常.

#默认为10

hystrix.command.default.fallback.isolation.semaphore.maxConcurrentRequests = 500

#当HystrixCommand.run()使用SEMAPHORE的隔离策略时，设置最大的并发量

hystrix.command.default.execution.isolation.semaphore.maxConcurrentRequests = 1000

#是否开启断路器功能，默认为true

hystrix.command.default.circuitBreaker.enabled=true

#该属性设置滚动窗口中将使断路器跳闸的最小请求数量

#如果此属性值为20，则在窗口时间内（如10s内），如果只收到19个请求且都失败了，则断路器也不会开启。

#默认值：20

hystrix.command.default.circuitBreaker.requestVolumeThreshold=200

#断路器跳闸后，在此值的时间的内，hystrix会拒绝新的请求，只有过了这个时间断路器才会打开闸门

#默认值：5000

hystrix.command.default.circuitBreaker.sleepWindowInMilliseconds=60000

#设置失败百分比的阈值。如果失败比率超过这个值，则断路器跳闸并且进入fallback逻辑

#默认值：50 ，即50%

hystrix.command.default.circuitBreaker=50

#如果设置true，则强制使断路器进行关闭状态，此时会允许执行所有请求，无论是否失败的次数达到circuitBreaker.errorThresholdPercentage值

#默认值：false

hystrix.command.default.circuitBreaker.forceOpe=false

#如果设置true，则强制使断路器进行关闭状态，此时会允许执行所有请求，无论是否失败的次数达到circuitBreaker.errorThresholdPercentage值

#默认值：false

hystrix.command.default.circuitBreaker.forceClosed=false

#设置线程池的core size,这是最大的并发执行数量。默认10

hystrix.threadpool.default.coreSize=500

#最大队列长度。设置BlockingQueue的最大长度。默认-1。

#如果设置成-1，就会使用SynchronizeQueue。

#如果其他正整数就会使用LinkedBlockingQueue。

hystrix.threadpool.default.maxQueueSize=1000

#设置拒绝请求的临界值。只有maxQueueSize为-1时才有效。

#设置设个值的原因是maxQueueSize值运行时不能改变，我们可以通过修改这个变量动态修改允许排队的长度。默认5

hystrix.threadpool.default.queueSizeRejectionThreshold=1000

#设置统计滚动窗口的时间长度，默认值：10000

hystrix.command.default.metrics.rollingStats.timeInMilliseconds=10000

#设置统计滚动窗口的桶数量，

#注意：以下配置必须成立，否则会抛出异常。

#metrics.rollingStats.timeInMilliseconds % metrics.rollingStats.numBuckets == 0

#如：10000/10、10000/20是正确的配置,但是10000/7错误的

#在高并发的环境里，每个桶的时间长度建议大于100ms

#默认值：10

hystrix.command.default.metrics.rollingStats.numBuckets=10

#设置执行延迟是否被跟踪，并且被计算在失败百分比中。如果设置为false,则所有的统计数据返回-1

#默认值： true

hystrix.command.default.metrics.rollingPercentile.enabled=true

#此属性设置统计滚动百分比窗口的持续时间，默认值：60000

hystrix.command.default.metrics.rollingPercentile.timeInMilliseconds=60000

#设置统计滚动百分比窗口的桶数量

#注意：以下配置必须成立，否则会抛出异常。

#metrics.rollingPercentile.timeInMilliseconds % metrics.rollingPercentile.numBuckets == 0

#如： 60000/6、60000/60是正确的配置,但是10000/7错误的

#在高并发的环境里，每个桶的时间长度建议大于1000ms

#默认值：6

hystrix.command.default.metrics.rollingPercentile.numBuckets=6

#此属性设置每个桶保存的执行时间的最大值。如果桶数量是100，统计窗口为10s，如果这10s里有500次执行，只有最后100次执行会被统计到bucket里去

#默认值：100

hystrix.command.default.metrics.rollingPercentile.bucketSize=100

#采样时间间隔

hystrix.command.default.metrics.healthSnapshot.intervalInMilliseconds=500

总结

多看官放文档,推荐看下hystrix是如何工作的,很精彩.去吧,再次方便你,学不好就怪自己太忙,没时间看文档吧: https://github.com/Netflix/Hystrix/wiki

有时间再把hystrix的监控写下,今天就这啦,88

Spring Cloud Hystrix 熔断器（五）的更多相关文章

spring cloud: Hystrix（五）：如禁止单个FeignClient使用hystrix
spring cloud: Hystrix(五):如禁止单个FeignClient使用hystrix 首先application.yml / applicatoin.propreties的配置项:fe ...
Spring Cloud Hystrix——熔断器
1.雪崩效应在微服务架构中通常会有多个服务层调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应.服务雪崩效应是一种因“服务提供者”的不可用导致“服务消费者 ...
Spring Cloud Hystrix熔断器隔离方案
Hystrix组件提供了两种隔离的解决方案:线程池隔离和信号量隔离.两种隔离方式都是限制对共享资源的并发访问量,线程在就绪状态.运行状态.阻塞状态.终止状态间转变时需要由操作系统调度,占用很大的性 ...
第五章服务容错保护：Spring Cloud Hystrix
在微服务架构中,我们将系统拆分为很多个服务,各个服务之间通过注册与订阅的方式相互依赖,由于各个服务都是在各自的进程中运行,就有可能由于网络原因或者服务自身的问题导致调用故障或延迟,随着服务的积压,可能 ...
第五章服务容错保护： Spring Cloud Hystrix
在微服务架构中, 存在着那么多的服务单元, 若一个单元出现故障, 就很容易因依赖关系而引发故障的蔓延,最终导致整个系统的瘫痪,这样的架构相较传统架构更加不稳定.为了解决这样的问题, 产生了断路器等一系 ...
Spring Cloud Hystrix 1（熔断器简介）
在分布式框架中当某个服务单元发生故障之后通过断路器的故障监控向调用方返回一个错误响应,而不是长期等待这样就不会使得线程因调用故障服务被长时间占用不放,避免了故障在分布式系统中的蔓延针对上述问题,Sp ...
Spring Cloud 微服务四：熔断器Spring cloud hystrix
前言:在微服务架构中,一般都是进程间通信,有可能调用链都比较长,当有底层某服务出现问题时,比如宕机,会导致调用方的服务失败,这样就会发生一连串的反映,造成系统资源被阻塞,最终可能造成雪崩.在sprin ...
spring cloud 入门系列五：使用Feign 实现声明式服务调用
一.Spring Cloud Feign概念引入通过前面的随笔,我们了解如何通过Spring Cloud ribbon进行负责均衡,如何通过Spring Cloud Hystrix进行服务断路保护,两 ...
微服务架构之spring cloud hystrix&hystrix dashboard
在前面介绍spring cloud feign中我们已经使用过hystrix,只是没有介绍,spring cloud hystrix在spring cloud中起到保护微服务的作用,不会让发生的异常无 ...

随机推荐

.NET 使用OLEDB导入Excel数据
/** * *在本章节中主要讲解的是如何使用OLEDB将Excel中的数据导入到数据库中 * */using System; using System.Data; using System.Data. ...
Flink中Idle停滞流机制(源码分析)
前几天在社区群上,有人问了一个问题既然上游最小水印会决定窗口触发,那如果我上游其中一条流突然没有了数据,我的窗口还会继续触发吗? 看到这个问题,我蒙了???? 对哈,因为我是选择上游所有流中水印最小 ...
学习Swoole需要掌握哪些基础知识
多进程/多线程了解Linux操作系统进程和线程的概念了解Linux进程/线程切换调度的基本知识了解进程间通信的基本知识,如管道.UnixSocket.消息队列.共享内存 SOCKET 了解SOC ...
Linux网络——配置防火墙的相关命令
Linux网络——配置防火墙的相关命令摘要:本文主要学习了如何在Linux系统中配置防火墙. iptables命令 iptables准确来讲并不是防火墙,真正的防火墙是运行于系统内核中的netfil ...
JS基础语法---分支语句之：switch-case语句---3个练习
switch-case语句---分支语句---多分支语句语法: switch(表达式){ case 值1:代码1;break; case 值2:代码2;break; case 值3:代码3;brea ...
Element-ui中ElScrollBar组件滚动条的使用
在翻看 element-ui官网的文档时,发现其左侧导航和右边的内容超出屏幕时,滚动条的样式比较小巧,通过浏览器审查工具查看,发现它是使用了el-scrollbar的样式,跟element-ui的组件 ...
kali linux查看局域网下所有IP，并对指定IP实施局域网内攻击(断网，随时查看对方密码，上网痕迹等)
首先我们打开我们熟悉的kali linux操作系统,利用指令: ifconfig 来确认本机的ip地址确认了本机的ip地址之后,利用一下的指令查看局域网下所有ip: fping -g 本机IP地址/ ...
andriod8.1.0源码编译中的一个坑-package com.sun.javadoc does not exist
这里记录编译过程中的一个坑!!! 编译过程中出现了下面的报错 external/doclava/src/com/google/doclava/ClassInfo.java:20: error: pac ...
Oracle大数据解决方案》学习笔记5——Oracle大数据机的配置、部署架构和监控-1（BDA Config, Deployment Arch, and Monitoring）
原创预见未来to50 发布于2018-12-05 16:18:48 阅读数 146 收藏展开这章的内容很多,有的学了. 1. Oracle大数据机——灵活和可扩展的架构 2. Hadoop集群的 ...
openssl rsa加密，解密以及X509证书的使用
Openssl的相关使用生成证书生成证书见:使用 openssl 生成证书代码实现 Cert.h #ifndef _CERT_H #define _CERT_H ///header files ...

Spring Cloud Hystrix 熔断器（五）

序言

熔断器

限流