概述

书接上回:你来说说什么是限流? ,限流的整体概述中,描述了 限流是什么限流方式限流的实现。在文章尾部的 分布式限流,没有做过多的介绍,选择了放到这篇文章中。给大伙细细讲解一下 Sentinel

附带最权威的官方wiki: 《Alibaba-Sentinel,新手指南》

本篇文章源码地址: https://github.com/jaycekon/SpringBoot

Sentinel 是啥?

分布式系统的流量防卫兵

再引用一下之前我画的图:

流量防卫兵 它具备了哪些能力?

Sentinel 的生态环境

随着 Alibaba 的 Java 生态建设,包括 Spring Cloud AlibabaRocketNacos等多项开源技术的贡献,目前 Sentinel 对分布式的各种应用场景都有了良好的支持和适配,这也是为什么我们选择 Sentinel 学习的原因之一(学习成本低,应用场景多)

Sentinel 核心概念

1、资源

资源Sentinel 中的核心概念之一。最常用的资源是我们代码中的 Java 方法,一段代码,或者一个接口

Java方法:

@SentinelResource("HelloWorld")
public void helloWorld() {
// 资源中的逻辑
System.out.println("hello world");
}

一段代码:

        // 1.5.0 版本开始可以直接利用 try-with-resources 特性,自动 exit entry
try (Entry entry = SphU.entry("HelloWorld")) {
// 被保护的逻辑
System.out.println("hello world");
} catch (BlockException ex) {
// 处理被流控的逻辑
System.out.println("blocked!");
}

一个接口:

@RestController
public class TestController {
@GetMapping("/test")
public String test(){
return "test";
}
}

配合控制台使用:

2、规则

Sentinel 中的规则 提供给用户,针对不同的场景而制定不同的保护动作,规则的类型包括:

  • 流量控制规则
  • 熔断降级规则
  • 系统保护规则
  • 来源访问控制规则
  • 热点参数规则

本文主要会讲解 流量熔断系统保护这三个规则。

定义规则:

    private static void initFlowRules(){
List<FlowRule> rules = new ArrayList<>();
FlowRule rule = new FlowRule();
//绑定资源
rule.setResource("HelloWorld");
//限流阈值类型
rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
//数量级别
rule.setCount(20);
//添加到本地内存
rules.add(rule);
FlowRuleManager.loadRules(rules);
}

限流规则重要属性说明:

Field 说明 默认值
resource 资源名,资源名是限流规则的作用对象
count 限流阈值
grade 限流阈值类型,QPS 模式(1)或并发线程数模式(0) QPS 模式
limitApp 流控针对的调用来源 default,代表不区分调用来源
strategy 调用关系限流策略:直接、链路、关联 根据资源本身(直接)
controlBehavior 流控效果(直接拒绝/WarmUp/匀速+排队等待),不支持按调用关系限流 直接拒绝
clusterMode 是否集群限流

Sentinel 限流

1、单机限流

1.1、引入依赖

在上一篇文章中,有提到过 RateLimiter 实现的单机限流, 这里介绍一下,使用 Sentinel 实现的单机限流

//项目中引入 sentinel-core 依赖
<dependency>
<groupId>com.alibaba.csp</groupId>
<artifactId>sentinel-core</artifactId>
<version>1.8.1</version>
</dependency>

1.2、定义限流规则

定义保护规则:

    private static void initFlowRules(){
List<FlowRule> rules = new ArrayList<>();
FlowRule rule = new FlowRule();
//绑定资源
rule.setResource("HelloWorld");
//限流阈值类型
rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
//数量级别
rule.setCount(20);
//添加到本地内存
rules.add(rule);
FlowRuleManager.loadRules(rules);
}

1.3、定义限流资源

根据上面描述的 资源划分, 我们这里主要将 代码块 定义为资源。

public static void main(String[] args) {
// 配置规则.
initFlowRules(); while (true) {
// 1.5.0 版本开始可以直接利用 try-with-resources 特性,自动 exit entry
try (Entry entry = SphU.entry("HelloWorld")) {
// 被保护的逻辑
System.out.println("hello world");
} catch (BlockException ex) {
// 处理被流控的逻辑
System.out.println("blocked!");
}
}
}

1.4、运行结果

Demo 运行之后,我们可以在日志 ~/logs/csp/${appName}-metrics.log.xxx 里看到下面的输出:

➜  csp cat com-jaycekon-sentinel-demo-FlowRuleDemo-metrics.log.2021-07-03

|--timestamp-|------date time----|-resource-|p |block|s |e|rt
1625294582000|2021-07-03 14:43:02|HelloWorld|20|1720|20|0|2|0|0|0
1625294583000|2021-07-03 14:43:03|HelloWorld|20|5072|20|0|0|0|0|0
1625294584000|2021-07-03 14:43:04|HelloWorld|20|6925|20|0|0|0|0|0
  • p 代表通过的请求
  • block 代表被阻止的请求
  • s 代表成功执行完成的请求个数
  • e 代表用户自定义的异常
  • rt 代表平均响应时长

Sentinel 的单机限流 ,和 RateLimiter 有什么区别呢?

Field 分布式环境下实现难度 空间复杂度 时间复杂度 限制突发流量 平滑限流
令牌桶 低O(1) 高O(N)
滑动窗口 高O(N) 中O(N) 相对实现

附录:《Sentinel - 滑动窗口实现原理》

2、控制台限流

2.1、客户端接入控制台

超详细文档,参考:《Sentinel - 控制台》

Sentinel 提供一个轻量级的开源控制台,它提供机器发现以及健康情况管理、监控(单机和集群),规则管理和推送的功能。

下载Jar 包(21M),或者下载源码(4M) 后自行进行编译(不建议,编译花的时间比直接下载jar包还要久)

https://github.com/alibaba/Sentinel/releases

编译后,启动命令

java -Dserver.port=8000 -Dcsp.sentinel.dashboard.server=localhost:8000 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard-1.8.1.jar

进入控制台

2.2、引入依赖

客户端需要引入 Transport 模块来与 Sentinel 控制台进行通信。您可以通过 pom.xml 引入 JAR 包

<dependency>
<groupId>com.alibaba.csp</groupId>
<artifactId>sentinel-transport-simple-http</artifactId>
<version>1.8.1</version>
</dependency> //重要的依赖,还是提前先写上吧,避免小伙伴找不到了
<dependency>
<groupId>com.alibaba.csp</groupId>
<artifactId>sentinel-web-servlet</artifactId>
<version>1.8.1</version>
</dependency>

然后!!! 烦了我一下午的地方来了!! 在官方文档中,指出了需要引入对应的依赖配置 , 好家伙,那么重要的话,你如此轻描淡写,脑壳疼啊!!!

对应的适配依赖有

好家伙,基本上所有业务场景都覆盖到了! 由于我的 Demo 项目是基于 SpringBoot ,然后想看看 云原生微服务体系下的视频,好家伙,要用 SpringCloud , 想要了解的,可以参考: 《Spring-Cloud-Sentinel》

2.3、定义资源

@SpringBootApplication
@Configuration
@RestController
public class SpringBootSentinelApplication { public static void main(String[] args) {
SpringApplication.run(SpringBootSentinelApplication.class, args);
} @Bean
public FilterRegistrationBean sentinelFilterRegistration() {
FilterRegistrationBean<Filter> registration = new FilterRegistrationBean<>();
registration.setFilter(new CommonFilter());
registration.addUrlPatterns("/*");
registration.setName("sentinelFilter");
registration.setOrder(1); return registration;
} @RequestMapping("/index")
public String index(){
return "hello index";
} }

在概述中,我们有提到过,需要被保护的资源,可以是 一个代码块一个方法或者一个接口。这里通过 Filter 的 方式,将所有请求都定义为资源 (/*), 那么我们在请求的过程就会变成这样子:

2.4、运行结果

添加启动参数

-Dserver.port=8088 -Dcsp.sentinel.dashboard.server=localhost:8080 -Dproject.name=jaycekon-sentinel

参数说明:

  • server.port : 服务启动端口
  • csp.sentinel.dashboard.server : 状态上报机器ip:端口
  • project.name : 监控项目名称

运行结果:

2.5、限流配置

流控效果

  • 1、快速失败:直接失败
  • 2、Warm Up:预热模式,根据codeFactory的值(默认3),从阈值/codeFactory,经过预热时长,才达到设置的QPS阈值。比如设置QPS为90,设置预热为10秒,则最初的阈值为90/3=30,经过10秒后才达到90。
  • 3、排队等待:比如设置阈值为10,超时时间为500毫秒,当第11个请求到的时候,不会直接报错,而是等待500毫秒,如果之后阈值还是超过10,则才会被限流。

运行结果:

3、集群限流

讲了那么多,终于要到核心的 集群限流方案了, 在秒杀系统设计中,我们谈到很多场景都是以单机作为具体案例进行分析,如果我们的系统要扩容,那么如何做好限流方案。假设集群中有 10 台机器,我们给每台机器设置单机限流阈值为 10 QPS,理想情况下整个集群的限流阈值就为 100 QPS。不过实际情况下流量到每台机器可能会不均匀,会导致总量没有到的情况下某些机器就开始限流。因此仅靠单机维度去限制的话会无法精确地限制总体流量。而集群流控可以精确地控制整个集群的调用总量,结合单机限流兜底,可以更好地发挥流量控制的效果。

介绍一下集群限流的核心角色:

  • Token Client:集群流控客户端,用于向所属 Token Server 通信请求 token。集群限流服务端会返回给客户端结果,决定是否限流。
  • Token Server:即集群流控服务端,处理来自 Token Client 的请求,根据配置的集群规则判断是否应该发放 token(是否允许通过)。

在嵌入模式下的结构图:

在独立模式下的结构图:

内嵌模式,即 发Token 的操作,有其中某一个实例完成,其他 Client 通过向 Server 请求,获取访问许可。

独立模式,即作为独立的 token server 进程启动,独立部署,隔离性好,但是需要额外的部署操作。

3.1、阿里云AHAS

在上述示例代码中,使用了本地模式的 Demo, 在集群限流的场景,这里用一下 阿里云提供的 AHAS 服务。

控制台地址: https://ahas.console.aliyun.com/index?ns=default&region=public

引入依赖:

//sentinel ahas 依赖,包括了sentinel的使用依赖<dependency>    <groupId>com.alibaba.csp</groupId>    <artifactId>ahas-sentinel-client</artifactId>    <version>1.8.8</version></dependency>

这里有个要注意的点, AHAS 的依赖,包含了 Sentinel ,所需要使用到的依赖,包括 sentinel-core,sentinel-web-servletsentinel-transport-simple-http

否则会出现 Spi 异常 , 如果对 Spi 不太了解,建议加群提问,嘿嘿~

com.alibaba.csp.sentinel.spi.SpiLoaderException

3.2、开启阿里云AHAS 服务

这里有官方的开通文档,我就不赘述了,文档地址

在应用防护这里找到 Lincense ,然后添加启动参数:

-Dserver.port=8092 -Dproject.name=jaycekon-sentinel -Dahas.license=d1e21b0c8f2e4d87b5ac460b118dc58d -Dcsp.sentinel.log.use.pid=true

由于我们要本地启动多实例, 因此需要修改服务的多个端口:

java -Dserver.port=8090 -Dproject.name=jaycekon-sentinel -Dahas.license=d1e21b0c8f2e4d87b5ac460b118dc58d  -Dcsp.sentinel.log.use.pid=true -jar sentinel-ahas-0.0.1-SNAPSHOT.jarjava -Dserver.port=8091 -Dproject.name=jaycekon-sentinel -Dahas.license=d1e21b0c8f2e4d87b5ac460b118dc58d  -Dcsp.sentinel.log.use.pid=true -jar sentinel-ahas-0.0.1-SNAPSHOT.jarjava -Dserver.port=8092 -Dproject.name=jaycekon-sentinel -Dahas.license=d1e21b0c8f2e4d87b5ac460b118dc58d  -Dcsp.sentinel.log.use.pid=true -jar sentinel-ahas-0.0.1-SNAPSHOT.jar

产生访问流量后,可以在大盘看到机器的链接状态:

http://localhost:8092/index

3.3、集群流控规则配置

这里有个两个概念:

  • 集群阀值:指的是,我们集群总体能通过的访问量,可能存在分配不均的情况(能避免单机误限)。
  • 退化单机:当 Token Server 访问超时,即无法从远端获取令牌时,回退到单机限流

测试限流, 只访问 http://localhost:8092/index

通过手刷(手速过硬~),触碰到限流的临界值,然后整体限流跟我们预期一致。

退化单机

在集群流控这里,有个 Token 请求超时时间,Client 请求 Server ,然后返回数据结果。整个流程会有网络请求的耗时,在上面的测试流程中,我将超时时间调大了,每次请求都能拿到Token, 通过修改请求超时时间,触发退化 单机限流

运行结果:

3.4、Server 角色转换

在内嵌模式下,通过 HTTP API的方式,将角色转换为 Serverclient

http://<ip>:<port>/setClusterMode?mode=<xxx>

其中 mode 为 0 代表 client,1 代表 server,-1 代表关闭。注意应用端需要引入集群限流客户端或服务端的相应依赖。

在独立模式下,我们可以直接创建对应的 ClusterTokenServer 实例并在 main 函数中通过 start 方法启动 Token Server。

Sentinel 熔断

秒杀系统 的案例中,一个完整的链路可能包含了 下订单支付物流对接等多个服务(实际上不止那么少)。在一个完整的链路中,各个系统通过 rpc/http的形式进行交互,在下面的链路图中,如果用户选择的 支付方式,存在延时过高服务不稳定,或服务异常等情况,会导致整个链路没办法完成。最终的结果就是,用户明明抢到了,但是没办法支付,导致订单丢失。

现代微服务架构都是分布式的,由非常多的服务组成。不同服务之间相互调用,组成复杂的调用链路。以上的问题在链路调用中会产生放大的效果。复杂链路上的某一环不稳定,就可能会层层级联,最终导致整个链路都不可用。因此我们需要对不稳定的弱依赖服务调用进行熔断降级,暂时切断不稳定调用,避免局部不稳定因素导致整体的雪崩熔断降级作为保护自身的手段,通常在客户端(调用端)进行配置。

1、熔断降级

添加测试代码

    @RequestMapping("/myError")    public String error(){        if (true){            throw new RuntimeException("sentinel run error");        }        return "error";    }

Sentinel-Dashboard 中配置降级规则

![image-20210706005136317](/Users/huangweijie/Library/Application Support/typora-user-images/image-20210706005136317.png)

![image-20210706005159415](/Users/huangweijie/Library/Application Support/typora-user-images/image-20210706005159415.png)

降级保护效果:

用户通过访问接口 /myError , 出现一次异常后,在接下来的10秒 ,都会走降级策略,直接返回。能够很好的保护服务端避免异常过多,占用机器资源。同时快速响应用户请求。

2、熔断策略

Sentinel 提供以下几种熔断策略:

  • 慢调用比例 (SLOW_REQUEST_RATIO):选择以慢调用比例作为阈值,需要设置允许的慢调用 RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用。当单位统计时长(statIntervalMs)内请求数目大于设置的最小请求数目,并且慢调用的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求响应时间小于设置的慢调用 RT 则结束熔断,若大于设置的慢调用 RT 则会再次被熔断。
  • 异常比例 (ERROR_RATIO):当单位统计时长(statIntervalMs)内请求数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。异常比率的阈值范围是 [0.0, 1.0],代表 0% - 100%。
  • 异常数 (ERROR_COUNT):当单位统计时长内的异常数目超过阈值之后会自动进行熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。

总结

本文主要详细讲解了一下 如何通过 Sentinel 去实际接触 限流和熔断,对于限流的底层实现,后续会有专门的源码分析篇。对于熔断,本文也没有细说个究竟,下一篇文章会给大家带来,熔断是什么,在系统中到底是怎么实际使用,以及常见的熔断策略。

项目源码地址: https://github.com/jaycekon/SpringBoot

欢迎 StarFork

点关注,不迷路

好了各位,以上就是这篇文章的全部内容了,我后面会每周都更新几篇高质量的大厂面试和常用技术栈相关的文章。感谢大伙能看到这里,如果这个文章写得还不错, 求三连!!! 创作不易,感谢各位的支持和认可,我们下篇文章见!

我是 九灵 ,有需要交流的童鞋可以 加我wx,Jayce-K,关注公众号:Java 补习课,掌握第一手资料!

如果本篇博客有任何错误,请批评指教,不胜感激 !

限流神器Sentinel,不了解一下吗?的更多相关文章

  1. 阿里限流神器Sentinel夺命连环 17 问?

    1.前言 这是<spring Cloud 进阶>专栏的第五篇文章,这篇文章介绍一下阿里开源的流量防卫兵Sentinel,一款非常优秀的开源项目,经过近10年的双十一的考验,非常成熟的一款产 ...

  2. 阿里巴巴开源限流组件Sentinel初探

    1 Sentinel主页 https://github.com/alibaba/Sentinel/wiki/主页 1.1 Sentinel介绍 随着微服务的流行,服务和服务之间的稳定性变得越来越重要. ...

  3. 令牌桶、漏斗、冷启动限流在sentinel的应用

    分布式系统为了保证系统稳定性,在服务治理的限流中会根据不同场景进行限流操作,常见的限流算法有: 令牌桶:可容忍一定突发流量的速率的限流,令牌桶算法的原理是系统以恒定的速率产生令牌,然后把令牌放到令牌桶 ...

  4. Spring Cloud微服务限流之Sentinel+Apollo生产实践

    Sentinel概述 在基于Spring Cloud构建的微服务体系中,服务之间的调用链路会随着系统的演进变得越来越长,这无疑会增加了整个系统的不可靠因素.在并发流量比较高的情况下,由于网络调用之间存 ...

  5. Spring Cloud Gateway 整合阿里 Sentinel网关限流实战!

    大家好,我是不才陈某~ 这是<Spring Cloud 进阶>第八篇文章,往期文章如下: 五十五张图告诉你微服务的灵魂摆渡者Nacos究竟有多强? openFeign夺命连环9问,这谁受得 ...

  6. Spring Cloud alibaba网关 sentinel zuul 四 限流熔断

    spring cloud alibaba 集成了 他内部开源的 Sentinel 熔断限流框架 Sentinel 介绍 官方网址 随着微服务的流行,服务和服务之间的稳定性变得越来越重要.Sentine ...

  7. 快速体验 Sentinel 集群限流功能,只需简单几步

    ️ Pic by Alibaba Tech on Facebook 集群限流 可以限制某个资源调用在集群内的总 QPS,并且可以解决单机流量不均导致总的流控效果不佳的问题,是保障服务稳定性的利器. S ...

  8. SpringCloud Gateway高阶之Sentinel限流、熔断

    前言 为什么需要服务熔断和降级?微服务是当前业界的一大趋势,原理就是将单一职责的功能模块独立化为子服务,降低服务间的耦合,服务间互相调用.但是这样也会出现一些问题: 上图中大量微服务互相调用,存在大量 ...

  9. SpringCloud微服务实战——搭建企业级开发框架(十四):集成Sentinel高可用流量管理框架【限流】

      Sentinel 是面向分布式服务架构的高可用流量防护组件,主要以流量为切入点,从限流.流量整形.熔断降级.系统负载保护.热点防护等多个维度来帮助开发者保障微服务的稳定性. Sentinel 具有 ...

随机推荐

  1. 通过Cloudflare开启全站https

    Cloudflare 添加域名后,会自动生成通用证书,快速开启全站HTTPS,服务端不用做任何修改,还可以选择多种开启模式 一.注册Cloudflare账号 直接打开网站:https://www.cl ...

  2. 用JIRA管理你的项目——(三)基于LDAP用户管理

    JIRA提供了基于LDAP方式的用户管理,也就是用户密码的管理交给LDAP,而JIRA只管理用户在系统中的角色. 要打开JIRA的LDAP设置,首先需要验证下你的LDAP服务是否正常! 几乎有所有的L ...

  3. 马哥Linux SysAdmin学习笔记(三)

    CentOS 5和6的启动流程: Linux:kernel+rootfs kernel:进程管理,内存管理,网络管理,驱动程序,文件系统,安全功能 rootfs: glibc 库:函数集合,funct ...

  4. gpgj-12 ROIC估值法总结

    1.公司甲乙丙 ·公司的分类: 1.ROIC  <    10%的公司        不赚钱的公司,价值摧毁者,避免投资这种 2.ROIC 约等于 10%的公司        勉强能够糊口,EV ...

  5. 优秀电路资料--- IOT方案

    完整的IOT方案 http://www.cirmall.com/circuit/4117/%E3%80%90%E5%BC%80%E6%BA%90%E3%80%91%E5%AE%8C%E6%95%B4% ...

  6. SSH工作过程简介和SSH协议算法集简介

    SSH简介 SSH是Secure Shell(安全外壳)的简称,是一种在不安全的网络环境中,通过加密机制和认证机制,实现安全的远程访问以及文件传输等业务的网络安全协议. SSH协议采用了典型的客户端/ ...

  7. 实操笔记:为 NSQ 配置监控服务的心路历程

    在 Go 语言实现的实时消息队列中, NSQ 的热度可以排第一. NSQ 这款消息中间件简单易用,其设计目标是为在分布式环境下运行,为去中心化服务提供一个强大的基础架构.它具有分布式.去中心化的拓扑结 ...

  8. Jquery ajax 详解(Day_16)

    太在意别人的看法最后会有两种结局,要么自己累死,要么让别人整死. 简介 AJAX 是与服务器交换数据的技术,它在不重载全部页面的情况下,实现了对部分网页的更新. 简短地说,在不重载整个网页的情况下,A ...

  9. Python小白的数学建模课-A1.2021年数维杯C题(运动会优化比赛模式探索)探讨

    Python小白的数学建模课 A1-2021年数维杯C题(运动会优化比赛模式探索)探讨. 运动会优化比赛模式问题,是公平分配问题 『Python小白的数学建模课 @ Youcans』带你从数模小白成为 ...

  10. Ubuntu1804下k8s-CoreDNS占CPU高问题排查

    1.背景: 最近在ubuntu804上适配k8s的时候,部署到业务pod的时候,出现了服务器卡死,top查看发现负载很高,进行CPU排序发现如下信息,可知是CoreDNS服务导致. 2. 分析排查: ...