1 背景

我们之前介绍过，随着业务流量上涨之后，我们的系统需要适时的进行扩容。

数据存储层我们也介绍过MySQL的扩容 Scale UP（纵向扩展）和 Scale Out（横向扩展）

垂直拆分（Scale Up 纵向扩展）：包括垂直分库、垂直分表
水平拆分（Scale Out 横向扩展）：包括库内分表、分库分表

详细可以参考笔者这几篇：

《MySQL全面瓦解28：分库分表》

《MySQL全面瓦解29：分库分表之Partition功能详解》

《数据库系列：数据库高可用及无损扩容》

存储层有高效动态的扩缩容机制，那计算服务也应该同步有这种能力，这样才能保证流量上涨时能够快速扩容。

如下图，蓝色部件是扩容的部分，每一分层都有自己的扩容机制。

现在服务大都为云上服务，所以接下来我们详细介绍下Kubernetes中的HPA和VPA。

2 容器扩缩容介绍

2.1 先看下 HPA 和 VPA 的概念

VPA（Vertical Pod Autoscaler）和HPA（Horizontal Pod Autoscaler）都是Kubernetes中的自动扩展功能，但它们的作用对象和扩展方式不同。

HPA（纵向）的作用对象是Pod的数量。 它通过监控CPU使用率、内存使用率等指标，根据预设的阈值自动调整Pod的数量（即当个集群副本的数量）。当Pod的CPU和内存使用率超过阈值时，HPA会自动增加Pod的数量；当使用率下降时，HPA会自动减少Pod的数量。

VPA的作用对象是Pod的资源需求，如CPU、内存等。 它通过监控Pod的资源使用情况，根据实际的资源需求自动调整Pod的资源限制和请求。当Pod的资源使用率高于资源请求时，VPA会自动增加Pod的资源Request和Limit；当资源使用率下降时，VPA会自动减少Pod的资源Requist和Limit。这种方式可以帮助优化资源利用率，避免资源浪费。

2.2 HPA实现详解

HPA（纵向）的作用对象是Pod的数量。可针对CPU使用率、内存使用率进行扩缩容配置，会根据期望指标，会触发扩容或者缩容，若同时有多个指标，会取Max值。

如下图：

解读下：

设计HPA资源，包含实现扩容的条件
策略Yaml应用到HPA控制器中
HPA控制器监听Prometheus，获取多个Metrix指标，如内存、CPU、连接数等
当监听的数据值大于等于扩容条件的阈值的时候，执行扩容操作
修改 replication controller, deployment, replica set, stateful set 中的pod数量
控制器定期调整副本控制器（replica set）或部署（deploy）中副本的数量

算法解析：

desiredReplicas = ceil[currentReplicas * ( currentMetricValue / desiredMetricValue )]

即 (当前指标值期望指标值) ️ 当前副本数，结果再向上取整，最终结果就是期望的副本数量

举例说明：

apiVersion: autoscaling/v2beta2

kind: HorizontalPodAutoscaler

metadata:

  name: hpa-example

spec:

  scaleTargetRef:

    apiVersion: apps/v1

    kind: Deployment

    name: hpa-example

  minReplicas: 10  # Pod副本数下限

  maxReplicas: 20  # Pod副本数上限

  metrics:

  - type: Resource

    resource:

      name: cpu

      target:

        type: Utilization

        averageUtilization: 60  # 当CPU利用率大于60%或者内存占用大于60%的时候，执行调整

假设当前指标：CPU利用率 70%
期望指标：CPU利用率60%
假设当前副本数：10
期望副本数：ceil(10*(70/60))=12
最终总的Pod副本数应该是12，即扩容数量为2
注意扩容和缩容幅度不能超过 HorizontalPodAutoscaler 资源中的副本上下限

2.3 VPA实现详解

因为VPA影响的是Pod的Request和Limit这两个参数，所以我们先了解下这两个属性的含义。

1. Request表示容器在运行过程中所需的最小资源量，即容器启动时的资源保证。

当Pod被调度到节点上时，Kubernetes会确保该节点上至少有足够的资源来满足Pod中所有容器的Request值。如果节点的可用资源无法满足Pod的Request值，则不会被调度到该节点上，而是保持在Pending状态，直到找到满足条件的节点为止。

因此，合理设置Request值可以确保Pod的稳定性和可靠性。

2. Limit则表示容器在运行过程中可以使用的最大资源量，即容器可以消耗的资源上限。

如果容器的实际资源使用量超过了Limit值，Kubernetes会采取相应的措施来限制容器的资源使用，例如限制CPU使用率、杀死进程等，以确保不会因资源不足而导致系统崩溃或性能下降。

通过设置Limit值，可以有效地防止单个容器或整个Pod占用过多的资源，从而影响整个集群的性能和稳定性。

apiVersion: v1

kind: Pod

  - apiVersion: v1

  name: xx-default-756gh8588cc

  namespace: xx-ns

spec:

  containers:

    name: xx-default

    resources:

      limits:  # 对应上限最大值

        cpu: "2"

        memory: 8G

      requests:  # 对应下限最小值

        cpu: 200m

        memory: 500Mi

而 VPA 是Kubernetes的一种自动调整Pod资源请求(Request)配额的工具。通过VPA，您可以根据Pod的实际资源使用情况动态地调整其CPU和内存资源请求（Request），以实现更精细的资源管理和更好的资源利用率。

简单理解就是取服务一定周期内（如8天内） CPU 和内存资源用量的 TP90 分位数据作为推荐值，可以参考kubernetes的算法

举例说明：

apiVersion: autoscaling.k8s.io/v1

kind: VerticalPodAutoscaler

metadata:

  name: myapp-vpa-default

  namespace: xx-ns

spec:

  targetRef:

    apiVersion: apps/v1

    kind: Deployment

    name: myapp-vpa-default

  updatePolicy:

    updateMode: "Off"  # 不直接进行修改

status:

  recommendation:

    containerRecommendations:

    - containerName: msg-index-default

      lowerBound: # 下限值

        cpu: 480m

        memory: "7117753323"

      target:  # 推荐值

        cpu: 930m

        memory: "8701517761"

      uncappedTarget:

        cpu: 930m

        memory: "8701517761"

      upperBound: # 上限值

        cpu: 1100m

        memory: "8841153193"

在这个配置中，我们定义了一个名为myapp-vpa的VPA，它将调整名为myapp的Deployment中的Pod的资源。

从输出信息可以看出，VPA对Pod给出了推荐值：Cpu: 930m，Memory: 8Gi，因为 updatePolicy 策略设置了updateMode: "Off"，所以不会主动更新Pod。

上面的案例可以通过下面的图进行演进：通过VPA的推荐，我们将Request值从 200m的CPU 和 500Mi 的内存，调整为 1 Core 的CPU 和 8Gi 的内存。

调优完成之后，资源分配更加合理，资源更充足，性能、稳定性更高。

3 总结

总的来说，HPA是通过自动调整Pod的数量来应对负载压力，而VPA是通过自动调整Pod的资源需求来优化资源利用率。它们可以配合使用，实现更加精细的自动扩展策略。保证流量动态变化的业务场景中实现资源的弹性伸缩，实现资源的最优合理性利用。

云原生：使用HPA和VPA实现集群扩缩容的更多相关文章

Airbnb的动态kubernetes集群扩缩容
Airbnb的动态kubernetes集群扩缩容本文介绍了Airbnb的集群扩缩容的演化历史,以及当前是如何通过Cluster Autoscaler 实现自定义扩展器的.最重要的经验就是Airbnb ...
三十三、HPA实现自动扩缩容
通过HPA实现业务应用的动态扩缩容 HPA控制器介绍当系统资源过高的时候,我们可以使用如下命令来实现 Pod 的扩缩容功能 $ kubectl -n luffy scale deployment m ...
基于云基础设施快速部署 RocketMQ 5.0 集群
本文作者:蔡高扬,Apache RocketMQ Committer, 阿里云智能技术专家. 背景上图左侧为 RocketMQ 4.x版本集群,属于非切换架构.NameServer 作为无状态节点可 ...
如何通过云效Flow完成自动化构建—构建集群
如何通过云效Flow完成自动化构建-构建集群,云效流水线Flow是持续交付的载体,通过构建自动化.集成自动化.验证自动化.部署自动化,完成从开发到上线过程的持续交付.通过持续向团队提供及时反馈,让交付 ...
如何根据不同业务场景调节 HPA 扩缩容灵敏度
背景在 K8s 1.18 之前,HPA 扩容是无法调整灵敏度的: 对于缩容,由 kube-controller-manager 的 --horizontal-pod-autoscaler-downs ...
主从集群搭建及容灾部署redis
redis主从集群搭建及容灾部署(哨兵sentinel) Redis也用了一段时间了,记录一下相关集群搭建及配置详解,方便后续使用查阅. 提纲 l Redis安装 l 整体架构 l Redis主 ...
【OpenStack云平台】网络控制节点 HA 集群配置
个人名片: 因为云计算成为了监控工程师‍ 个人博客:念舒_C.ying CSDN主页️:念舒_C.ying 网络控制节点运行在管理网络和数据网络中,如果虚拟机实例要连接到互联网,网络控制节点也需要具备 ...
SpringBoot之解决云服务器VPS在所处云端集群的内网不能解析域名的问题：java.net.UnknownHostException:abc.cn: Temporary failure in name resolution
一.起因与原因分析过程前端小伙伴儿告诉我,说服务器崩了. 请求数据接口,接口有响应,但报的json提示指向:数据库异常错误. 遂登陆云主机查看日志,核心记录显示如下: 2018-11-09 22:1 ...
腾讯云服务器 - 安装redis3.2.9以及集群
redis大家都知道,服务器上必不可少的,那么在生产环境下安装的步骤和虚拟机里也是差不多的官网上最新稳定版是3.2.9,而4.0的更新比较大,但是比几个还是beta版嘛下载并且上传压缩包至云服务器 ...
基于腾讯云CLB实现K8S v1.10.1集群高可用+负载均衡
概述: 最近对K8S非常感兴趣,同时对容器的管理等方面非常出色,是一款非常开源,强大的容器管理方案,最后经过1个月的本地实验,最终决定在腾讯云平台搭建属于我们的K8S集群管理平台~ 采购之后已经在本地 ...

随机推荐

截止2021年linux发行版
你应该知道的Hooks知识
Hooks Hooks 是 React16.8 的新增特性,能够在不写 class 的情况下使用 state 以及其他特性. 动机在组件之间复用状态逻辑很难复杂组件变得难以理解难以理解的 cla ...
ElasticSearch降本增效常见的方法 | 京东云技术团队
Elasticsearch在db_ranking 的排名不断上升,其在存储领域已经蔚然成风且占有非常重要的地位. 随着Elasticsearch越来越受欢迎,企业花费在ES建设上的成本自然也不少.那如 ...
Vue中is属性的用法可以动态切换组件
is 是组件的一个属性,用来展示组件的名称 is和component联用哈 vue提供了component来展示对应的组件名称 compont是一个占位符,is这个属性,用来展示对应的组件名称三个子 ...
TypeScript中泛型<T>详细讲解
1.泛型在定义函数或者接口或者类的时候不能预先确定要使用的数据类型而是在使用函数.接口.或者类的时候才能够确定数据类型这个时候我们就需要使用的是泛型 2.功能描述我们需要实现一个方法,方法中 ...
【三】强化学习之PaddlePaddlle-Notebook、&pdb、ipdb 调试---及PARL框架
相关文章: [一]飞桨paddle[GPU.CPU]安装以及环境配置+python入门教学 [二]-Parl基础命令 [三]-Notebook.&pdb.ipdb 调试 [四]-强化学习入门简 ...
CE修改器入门：未知数值扫描
经过第二关的练习,你已经理解了如何利用"精确数值"扫描查找数值了,让我们进行下一步,本关主要用来搜索进度条,人物血条等,因为这些数据通常是一个进度条,我们无法直接看到的数据,此时可 ...
CE修改器入门：查找多级指针
本关是第6关的加强版,CE 6.X 教程中的4级指针比5.X的要简单些.多级指针就像玩解谜游戏一样,谜团不只一个,盒子中还有盒子.这里面是4级指针,游戏中也有比如8级指针,12级指针等等,思路都是一样 ...
Python-单引号、双引号和三引号的作用和区别
(一).作用 1. 单引号:单引号内部为一串字符(str). 2. 双引号:双引号内部为一串字符,双引号内的字符串可以出现单引号(相当于双引号优先级更高),但不能嵌套双引号. 3. 三引号:用于换行输 ...
Linux-数据集 TPC-H、TPC-DS的导入和使用（MySQL）
一. TPC-H 数据集 1.数据集下载 TPC-H数据集: https://github.com/gregrahn/tpch-kit 可采用gcc下载或者直接下载zip包,然后解压即可. 具体使用方 ...

云原生：使用HPA和VPA实现集群扩缩容