Hystrix介绍

相对于单一系统,分布式系统更容易遇到故障,所以我们一般通过构建冗余,使用集群和负载均衡来保证系统的弹性和高可用。当然,这种方式只解决了一部分问题,当服务崩溃时,我们很容易检测到,因此可以分流到集群中其他的服务中。但是,如果整个服务集群运行缓慢,不仅难以检测原因,而且还会触发连锁效应,从而影响整个应用程序生态系统,如果没有保护措施,一个性能不佳的服务可以迅速拖跨整个应用程序。原因如下:

(1)服务的降级一般以某个问题开始,最终突然爆发,并形成不可逆转的势头。

(2)对于远程调用该服务的客户端服务,这个调用一般是同步的,并且会一直等待(如果没有设定超时)

(3)客户端服务遇到这种调用,通常设计为系统异常,而不是部分降级。

我们可以使用Netflix的Hystrix实现客户端弹性模式,当服务崩溃时我们可以让客户端快速失败,免于崩溃,从而不继续占用如数据库连接,线程池之类的宝贵资源,并且防止故障向上游的级联传播(stop cascading failure)。一般有4种客户端弹性模式:

(1)客户端负载均衡(client load balance)模式 - 在Spring Cloud中,Netflix Eureka及Ribbon实现了负载均衡,在服务发现(Eureka)一章中已经讲过,不再赘述

(2)断路器(circuit breaker)模式 - Netflix Hystrix

(3)后备(fallback)模式 - Netflix Hystrix

(4)舱壁(bulkhead)模式 - Netflix Hystrix

Hystrix策略

断路器(circuit breaker)模式

Hystrix默认的服务调用超时时间是是1s(execution.isolation.thread.timeoutInMilliseconds, default = 1000),当Hystrix遇到服务错误时,它将开始一个10s的窗口(计时器)(metrics.rollingStats.timeInMilliseconds, default = 10000),用于检查服务调用次数和故障百分比, 如果窗口期间没有达到最小调用次数20次(circuitBreaker.requestVolumeThreshold, default = 20),那么即使有几个(甚至全部)调用失败,Hystrix也不会采取行动(the circuit will not trip)。如果窗口期间达到最小调用次数20次,则要看故障百分比(circuitBreaker.errorThresholdPercentage, default = 50),如果故障百分比未超过50%,且10s的窗口已经过去,则Hystrix将重置断路器的统计信息,进入下一个10s,如果百分比超过50%的阈值,Hystrix将触发断路器,使将来几乎所有调用都失败(会让部分调用来进行测试,以检查服务是否恢复)。如果触发断路器,断路器跳闸后,将进入一个新的的5s窗口(circuitBreaker.sleepWindowInMilliseconds, default = 5000),即每隔5s调用一次这个“坏”服务,如果失败则HHystrix继续保持断开,并进入下一个5s的尝试。如果成功,则Hystrix将重置断路器的统计信息并恢复调用。

隔离策略(execution.isolation.strategy, default = THREAD):分为THREAD和SEMAPHORE。THREAD指在单独的线程上执行,并发请求受线程池中的线程数限制。SEMAPHORE指在调用线程上执行,并发请求量受信号量计数限制。在默认情况下,推荐HystrixCommands使用THREAD隔离策略,HystrixObservableCommand使用SEMAPHORE隔离策略。只有在高并发(单个实例每秒达到几百个调用)的调用时,才需要修改HystrixCommands的隔离策略为SEMAPHORE。

滑动窗口及桶(bucket)(metrics.rollingStats.numBuckets, default = 10):Hystrix的统计器是由滑动窗口(10s)来实现的,bucket是Hystrix统计滑动窗口数据时的最小单位。默认是10,即每滑过窗口的1/10就统计一次数据。

后备(fallback)模式

fallbackMethod属性在当前类中定义了一个方法,如果Hystrix执行失败,就执行该方法

舱壁(bulkhead)模式

在不使用舱壁模式的情况下,Hystrix默认共享同一个线程池来对各个服务执行调用的,而这些服务调用可能是各不相同,比如REST服务,数据库调用等。当某个服务存在大量请求时,Hystrix线程池中的线程可能会被耗尽,因为一个服务会占据默认线程池中的所有线程。而舱壁模式则是为一个微服务中不同的调用创建舱壁,即单独的线程池,池互不影响。我们使用threadPoolKey来定义一个线程池的名字,使用threadPoolProperties来配置属性,其中,coreSize定义线程池中线程的最大数量,maxQueueSize定义排队进入线程池的队列的大小。

[注] 上面标颜色的参数会在下面有具体的使用方式。

使用Hystrix

首先,在一个客户端服务中,在pom.xml中添加依赖spring-cloud-starter-netflix-hystrix。

<!-- Spring cloud starter: netflix-hystrix -->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

其次,在启动类Application中加入@EnableCircuitBreaker注解。

@SpringBootApplication
@EnableCircuitBreaker
public class Application {
public static void main(String[] args) {
SpringApplication.run(Application.class, args);
}
}

上面3种模式可以如下配置:

    @Autowired
private LoadBalancerClient loadBalancer; @Autowired
private OAuth2RestTemplate restTemplate; //@formatter:off
@HystrixCommand(
commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "1000"),
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "20"),
@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage", value = "50"),
@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds", value = "5000"),
@HystrixProperty(name = "metrics.rollingStats.timeInMilliseconds", value = "10000"),
@HystrixProperty(name = "metrics.rollingStats.numBuckets", value = "10")
}, // 断路器模式
fallbackMethod = "callFallbackMethod1", // 后备模式
threadPoolKey = "findAllPoolKey",
threadPoolProperties = {
@HystrixProperty(name = "coreSize", value = "10"),
@HystrixProperty(name = "maxQueueSize", value = "-1")
} // 舱壁模式
)
//@formatter:on
public String getSqlInfo(String env, String db, String name) { ServiceInstance instance = loadBalancer.choose("app-db");
String path = String.format("http://%s:%s/app-db/structure-search/app/MORT/env/%s/db/%s/name/%s",
instance.getHost(), instance.getPort(), env, db, name);
logger.info(path); ResponseEntity<String> response = restTemplate.exchange(path, HttpMethod.GET, null, String.class);
String body = response.getBody();
logger.info("The Response body is: " + body); return body;
} private String callFallbackMethod1(String env, String db, String name) {
return "Result is NULL";
}

我们也可以在类级别和整个应用程序级别设置这些参数。

在类级别是这样设置的:

@DefaultProperties(commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "3000") })
public class CallService {
}

在production环境中,我们有时候会需要调整Hystrix数据,这种情况下推荐将配置外部化到Spring Cloud Config中,这样就无须再修改代码,编译和部署:

hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds: 

Spring Cloud(4):断路器(Hystrix)的更多相关文章

  1. Spring Cloud入门教程-Hystrix断路器实现容错和降级

    简介 Spring cloud提供了Hystrix容错库用以在服务不可用时,对配置了断路器的方法实行降级策略,临时调用备用方法.这篇文章将创建一个产品微服务,注册到eureka服务注册中心,然后我们使 ...

  2. Spring Cloud 入门 之 Hystrix 篇(四)

    原文地址:Spring Cloud 入门 之 Hystrix 篇(四) 博客地址:http://www.extlight.com 一.前言 在微服务应用中,服务存在一定的依赖关系,如果某个目标服务调用 ...

  3. Spring Cloud(Dalston.SR5)--Hystrix 断路器-缓存

    在 Spring Cloud 中可以使用注解的方式来支持 Hystrix 的缓存,缓存与合并请求功能需要先初始化请求上下文才能实现,因此,必须实现 javax.servlet.Filter 用于创建和 ...

  4. Spring Cloud(Dalston.SR5)--Hystrix 断路器-合并请求

    在 Spring Cloud 中可以使用注解的方式来支持 Hystrix 的合并请求,缓存与合并请求功能需要先初始化请求上下文才能实现,因此,必须实现 javax.servlet.Filter 用于创 ...

  5. Spring Cloud(Dalston.SR5)--Hystrix 断路器

    Spring Cloud 对 Hystrix 进行了封装,使用 Hystrix 是通过 @HystrixCommand 注解来使用的,被 @HystrixCommand 注解标注的方法,会使用 Asp ...

  6. Spring Cloud Feign 整合 Hystrix

    在前面随笔Spring Cloud 之 Feign的feign工程基础上进行改造 1.pom.xml依赖不变 2.application.yml文件添加feign.hystrix.enabled=tr ...

  7. Spring Cloud Ribbon 整合 Hystrix

    在前面随笔 Spring Cloud 之 Ribbon 的ribbon工程基础上进行改造 1.pom.xml 加入依赖 <dependency> <groupId>org.sp ...

  8. 架构师入门:Spring Cloud系列,Hystrix与Eureka的整合

    和Ribbon等组件一样,在项目中,Hystrix一般不会单独出现,而是会和Eureka等组件配套出现.在Hystrix和Eureka整合后的框架里,一般会用到Hystrix的断路器以及合并请求等特性 ...

  9. spring cloud(断路器——初学四)

    在分布式架构中,当某个服务单元发生故障后,能通过断路器的故障监控,向调用方返回一个错误响应,而不是长时间的等待. Netflix Hystrix 在Spring Cloud中使用了Hystrix 来实 ...

  10. spring cloud 学习(4) - hystrix 服务熔断处理

    hystrix 是一个专用于服务熔断处理的开源项目,当依赖的服务方出现故障不可用时,hystrix有一个所谓的断路器,一但打开,就会直接拦截掉对故障服务的调用,从而防止故障进一步扩大(类似中电路中的跳 ...

随机推荐

  1. Mac环境下使用Appium Inspector进行元素定位

    一.摘要 本篇博文介绍在Mac系统上使用AppiumI Inspector进行App页面元素定位 二.Finding elements by xpath WebElement digit_9 = dr ...

  2. 表单重置时 <input type=“hidden”> 隐藏域不可被重置

    可封装全局样式 .hide{ display:none; } 用 <input type="text" class="hide"/> 替代

  3. linux基础_用户管理

    1.创建用户 基本语法 创建用户:useradd [选项] 用户名 (1)当传教用户成功后,会自动的创建和用户名同名的家目录. (2)也可以通过useradd -d 指定目录 新用户名,给新创建的用户 ...

  4. 服务器上的UID按钮

    定位用的,比如你机柜上有很多台机器,你在前面按下UID灯,机器后面也有一个UID灯会亮起来,这样当你到后面去的时候你就知道刚才在前面看的是哪一台,另外,有人通过ILO远程端口连接到你的服务器的时候,U ...

  5. mybayis项目使用的Mapping文件使用总结参考(二)

    针对in字句中的数组使用方法 <select id="getCpProfileNamesByIds" resultType="string"> se ...

  6. python一些方便excel行操作的函数(一)

    import collections class headhandler(): def __init__(self,mylist): self.mystorage={} self.mylist = m ...

  7. laravel常用响应操作

  8. python--openCV--图像处理

    安装 pip3 install opencv-python 图像处理: import cv2 #导入opencv库 import numpy as np img = cv2.imread(" ...

  9. toggle([speed],[easing],[fn]) 用于绑定两个或多个事件处理器函数,以响应被选元素的轮流的 click 事件。

    toggle([speed],[easing],[fn]) 概述 用于绑定两个或多个事件处理器函数,以响应被选元素的轮流的 click 事件. 如果元素是可见的,切换为隐藏的:如果元素是隐藏的,切换为 ...

  10. triggerHandler(type, [data])

    triggerHandler(type, [data]) 概述 这个特别的方法将会触发指定的事件类型上所有绑定的处理函数.但不会执行浏览器默认动作,也不会产生事件冒泡. 大理石平台价格 这个方法的行为 ...