https://www.jdon.com/springcloud/eureka-health-monitoring.html

运行阶段执行健康检查的目的是为了从Eureka服务器注册表中识别并删除不可访问的微服务，Eureka 服务器并不是向客户端发送心跳请求，而是反过来，Eureka 客户端将心跳发送到Eureka服务器，让服务器了解其状态。

这些心跳机制就需要在微服务嵌入一个客户端，用来发送心跳，但是客户端本身必须确定其健康状态，而且Eureka服务器必须为客户端公开一些REST操作以让其发布心跳。

Eureka服务器向客户端公开下面资源以让其发送心跳：

PUT /eureka/apps/{app id}/{instance id}?status={status}

{instance id}采用 hostname:app id:port，其中app id代表标识唯一的Eureka客户端实例，Eureka服务器会识别一些状态数值：UP; DOWN; STARTING; OUT_OF_SERVICE; UNKNOWN.

客户端发送心跳时的URL如下：

PUT /eureka/apps/ORDER-SERVICE/localhost:order-service:8886?status=UP

Eureka服务器收到心跳请求后，会续订该实例的租约。如果是第一个心跳，则Eureka服务器以404响应，之后客户端必须首先发送注册请求。

此外， Eureka服务器公开以下操作以允许健康状态的修改和删除：

PUT /eureka/apps/{app id}/{instance id}/status?value={status}

DELETE /eureka/apps/{app id}/{instance id}/status

修改操作（即PUT上面的操作）是用于手动获取健康的实例OUT_OF_SERVICE时操作，或者使用Asgard等管理工具（暂时禁止某些实例的流量）时操作。

这种修改操作对于“红/黑”部署非常有用，在这种情况下，你可以在一段时间内运行较旧版本的微服务（如果新版本不稳定，则可以轻松回滚到旧版本）。完成新版本的部署并且新版本开始为请求提供服务后，可以让旧版本OUT_OF_SERVICE（但不会让他们停止）暂停提供请求服务。即

PUT /eureka/apps/ORDER-SERVICE/localhost:order-service:8886/statusvalue=OUT_OF_SERVICE

上面修改的状态也可以被丢弃，我们可以指示让Eureka服务器开始遵守实例本身发布的状态，如下所示：

DELETE /eureka/apps/ORDER-SERVICE/localhost:order-service:8886/status

当您发现微服务的新版本不稳定并且您希望获得旧版本（即已经被打上OUT_OF_SERVICE标记的版本）以开始提供请求时，上述办法非常有用。

Eureka的健康检查

客户端需要在工程中添加组件依赖:

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-actuator</artifactId>

    <version>1.5..RELEASE</version>

</dependency>

然后在配置文件里面加上健康状态检查配置:

eureka:

  client:

    healthcheck:

      enabled: true

这时，启动自己的服务，通过http://localhost:port/health访问就可以得到服务的健康状态信息：

{"description":"Composite Discovery Client","status":"UP"}

当这个配置设置为false时，服务将不会把健康状态传递给Eureka，那么Eureka就不会再更新Status信息，但是此时仍能够通过上面的地址获取这个真实的状态信息。

应用状态的取值：UP，DOWN，OUT_OF_SERVICE，UNKNOWN等；只有标记为UP的微服务会被请求；

通过在application.yml中配置eureka.client.healthcheck.enabled = true，应用程序会将自己Spring Boot Actuator的/heath端点的健康状态传播到Eureka Server

这里的/health检查包括下面这些，其中还包括redis、mysql、hystrix等监控的检查：

如健康状况：

DiskSpaceHealthIndicator
RefreshScopeHealthIndicator
HystrixHealthIndicator

它将这些状态会映射到Eureka支持的状态之一，之后被映射后的状态将通过心跳传播到Eureka服务器。

列如一个应用实例在监控检查的时候发现当前的磁盘空间不够用了，就会通过心跳传递给Eureka服务器，这里时候你在Eureka服务器查询到当前应用实例的状态就是down状态

其他应用通过Eureka服务器获得当前应用实例的状态就是down，就无法访问改应用实例，应用实例只有up状态才能访问

Erueka状态变更说明

http://www.seotest.cn/jishu/41663.html

STARTING ：表示服务正在启动中

DOWN：表示服务已经宕机，无法继续提供服务

UP ：服务正常运行

OUT_OF_SERVICE : 不再提供服务，其他的Eureka Client将调用不到该服务，一般有人为的调用接口设置的，如：强制下线。

UNKNOWN：未知状态

容器启动

在容器刚刚启动，实例化instance信息的时候，默认状态为STARTING

在Eureka Client端，有一个40秒执行一次的定时任务，会定时的去扫描自身的信息，查看自身信息是否发生改变，

其中就有一个对状态的检测，这个时候，如果设置了健康检查器，那么会以健康检查的结果为准，判断当前实例的

状态，然后会通过心跳实例的最新状态重新注册到Eureka上面去。

Eureka客户端健康端点

Eureka客户端在向服务器注册时会在其POST的内容中加入healthCheckUrl ，这个healthCheckUrl的值是由以下实例属性计算得出：
eureka.instance.health-check-url
eureka.instance.health-check-url-path

.health-check-url-path的默认值是 /health，这是Springboot默认专门用于检查健康的actuator端点，除非.heath-check-url被专门配置了。

如果实现自定义健康状况端点或更改默认健康检查路径，则应配置这些属性：

endpoints.health.path=/new-heath

# either relative path

eureka.instance.health-check-url-path=${endpoints.health.path}

# or absolute path

eureka.instance.health-check-url=http://${eureka.hostname}:${server.port}/${endpoints.health.path}

如果你引入一个 management.context-path

management.context-path=/admin

# either relative path

eureka.instance.health-check-url-path=${management.context-path}/health

# or absolute path

eureka.instance.health-check-url=http://${eureka.hostname}:${server.port}/${management.context-path}/health

健康状况的试验

Eureka服务器并不关心客户端的状态 - 它只记录客户端状态，当有人查询其注册表时，它也会发布客户的健康状况。即

GET /eureka/apps/ORDER-SERVICE

<application>

   <name>DISCOVERY-EUREKA-CLIENT</name>

   <instance>

      <instanceId>localhost:discovery-eureka-client:</instanceId

      <ipAddr>192.168.1.6</ipAddr>

      <port></port>

      <status>UP</status>

      <overriddenstatus>UP</overriddenstatus>

      <healthCheckUrl>http://localhost:8886/health</healthCheckUrl>

      ...

      ...

   </instance>

</application>

这个响应有三个与健康有关的重要信息： status 、overridenstatus和healthCheckUrl

status 是Eureka实例本身发布的健康状况。
overriddenstatus 是手动或通过工具强制执行的健康状态。比如PUT /eureka/apps/{app id}/instance id}/status?value={status}操作用于修改发布的状态，那么status和overriddenstatus都将变更为新的状态。
healthCheckUrl 是客户端公开GET其健康状态的端点。

其他工具则可以利用这些健康信息：

客户端负载平衡器（如Ribbon）可以做出负载平衡决策 : Ribbon 读取 status 属性并仅使用具有UP 负载平衡状态的实例。但是，Ribbon不会调用 healthCheckUrl，而是依赖于注册表中可用的、已发布实例状态。如一个应用实例在Eureka在服务器上面的状态是down，Ribbon从Eureka服务器上面读取实例的状态是down，那么Ribbon就不会调用down状态的应用实例，但是你直接通过postman请求改应用实例是可以的，但是通过Ribbon是无法远程访问改应用实例的

健康状况的准确性

由于下面列出的原因，Eureka服务器注册表健康状况的并不总是准确的。

CAP中的AP - 由于Eureka在CAP定理方面定位于高度可用的系统，因此在网络分区期间，集群Eureka服务器之间的信息可能不一致。
服务器响应缓存 - Eureka服务器维护一个响应缓存，默认情况下每30秒更新一次。因此，实际上在 GET /eureka/apps/{app id}/ 响应中出现 UP 的实例可能已经DOWN 了。
定期调度心跳 - 由于客户端默认情况下每30秒发送一次心跳，因此服务器注册表中实例的运行状况可能不准确。
自我保护 - 当Eureka服务器没有收到超过某个阈值的心跳时，它会停止失效注册表中的客户端，从而会使注册表不准确。

因此，客户端应遵循适当的故障转移机制来补充这种不准确性。

Spring boot admin 节点状态一直为DOWN的排查（忽略某一个节点的健康检查）

某个应用实例运行成功后服务节点一直显示为DOWN，访问 http://127.0.0.1:8081/actuator/health健康检查端点返回值如下

可以看出redis 宕机了，但其实我项目本身没有使用redis。，我们可以在应该实例的健康检查中忽略redis的检查，这里在eureka服务器上面改应用实例的状态就不是down状态了。

在显示DOWN的客户端添加如下配置（忽略redis的健康检查）：

spring:

  profiles:

    active: dev

management:

  health:

    redis:

      enabled: false

  endpoint:

    health:

      show-details: always

  endpoints:

    web:

      exposure:

        include: "*"

server:

  port:

在spring boot admin监控中，一个应用下面存在3个应用实例，只要其中的一个应用实例的状态为down，那么该应用的状态就是down只要其中一个监控内容为DOWN,则该节点的总体状态就为DOWN

Eureka心跳健康检查机制和Spring boot admin 节点状态一直为DOWN的排查（忽略某一个节点的健康检查）的更多相关文章

Spring Boot Admin简介及实践
问题在若干年前的单体应用时代,我们可以相对轻松地对整个业务项目进行健康检查.指标监控.配置管理等等项目治理.如今随着微服务的发展,我们将大型单体应用按业务模型进行划分,以此形成众多小而自治的微服务, ...
Spring Boot，Spring Cloud，Eureka，Actuator，Spring Boot Admin，Stream，Hystrix
Spring Boot,Spring Cloud,Eureka,Actuator,Spring Boot Admin,Stream,Hystrix 一.Spring Cloud 之 Eureka. 1 ...
Spring Boot Admin 详解（Spring Boot 2.0，基于 Eureka 的实现）
原文:https://blog.csdn.net/hubo_88/article/details/80671192 Spring Boot Admin 用于监控基于 Spring Boot 的应用,它 ...
Spring Boot Admin实现服务健康预警
Over View 上一篇文章主要介绍了Spring Boot Admin的概况以及我们如何在系统中引入和使用Spring Boot Admin,以此来帮助我们更加了解自己的系统,做到能快速发现.排查 ...
spring boot 2.0.3+spring cloud （Finchley）8、微服务监控Spring Boot Admin
参考:Spring Boot Admin 2.0 上手 Spring Boot Admin 用于管理和监控一个或多个Spring Boot程序,在 Spring Boot Actuator 的基础上提 ...
Spring Boot admin 2.0 详解
一.什么是Spring Boot Admin ? Spring Boot Admin是一个开源社区项目,用于管理和监控SpringBoot应用程序. 应用程序作为Spring Boot Admin C ...
基于spring boot admin 做监控的一些问题记录
问题一各个健康节点权限问题解决方式加入权限模块 <dependency> <groupId>org.springframework.boot</groupId> ...
SpringBoot | 第二十八章：监控管理之Spring Boot Admin使用
前言上一章节,我们介绍了Actuator的使用,知道了可通过访问不同的端点路径,获取相应的监控信息.但使用后也能发现,返回的监控数据都是以JSON串的形式进行返回的,对于实施或者其他人员来说,不是很 ...
Spring Cloud第十三篇 | Spring Boot Admin服务监控
本文是Spring Cloud专栏的第十三篇文章,了解前十二篇文章内容有助于更好的理解本文: Spring Cloud第一篇 | Spring Cloud前言及其常用组件介绍概览 Spring Clo ...

随机推荐

python 验证码处理
一. 灰度处理,就是把彩色的验证码图片转为灰色的图片. 二值化,是将图片处理为只有黑白两色的图片,利于后面的图像处理和识别 # 自适应阀值二值化 def _get_dynamic_binary_ima ...
关于替换“c2a0”十六进制字符的方法
一.背景:在爬取网络小说生成的文件中,发现有些空格没法替换,使用十六进制编辑器查看,发现这些空格字符的十六进制值是“c2a0”,其来源是网页控制的特殊字符,这是一个叫做Non-breaking spa ...
.net core 基于AspNetCore.Identity+Identityserver4用户的权限管理
一般权限控制,是先给角色分配对应权限,然后再给用户分配角色:总权限应该是在代码编写的时候就已经固定了,例如有个用户更新的接口,这里就会诞生一个用户更新的权限,接口在权限就在,没有接口也就没有了这个权限 ...
CentOS 虚拟机下载及搭建
个人博客网:https://wushaopei.github.io/ (你想要这里多有) CentOS 虚拟机安装包下载 : 链接:https://pan.baidu.com/s/1JDIASm ...
Java实现 LeetCode 152 乘积最大子序列
152. 乘积最大子序列给定一个整数数组 nums ,找出一个序列中乘积最大的连续子序列(该序列至少包含一个数). 示例 1: 输入: [2,3,-2,4] 输出: 6 解释: 子数组 [2,3] ...
第四届蓝桥杯JavaC组省赛真题
解题代码部分来自网友,如果有不对的地方,欢迎各位大佬评论题目1.猜年龄题目描述美国数学家维纳(N.Wiener)智力早熟,11岁就上了大学.他曾在1935~1936年应邀来中国清华大学讲学. 一 ...
ant构建Jmeter脚本的build文件配置（build.xml）
使用此构建文件可自动发送邮件代码如下: <?xml version="1.0" encoding="UTF8"?> <project na ...
vue cli3 创建的项目中eslint 配置问题的解决
1-- vue cli3 项目文件结构 2-- 注释问题在eslintrc.js 文件中,将 '@vue/standard' 注释后重启即可: 3-- 配置 eslint 文件在 vue-cl ...
neo4j导入csv文件
neo4j导入csv文件关于neo4j的安装官网和网上博客提供了n中安装的方法,这里不再赘述: 普通安装: https://cloud.tencent.com/developer/article/ ...
jstl中<c:if>标签属性用法
今天用jstl+el从session域中获取属性,遇到了问题 org.apache.jasper.JasperException: <h3>Validation error message ...

Eureka心跳健康检查机制和Spring boot admin 节点状态一直为DOWN的排查（忽略某一个节点的健康检查）