1.什么是HPA？

在 Kubernetes 中，HorizontalPodAutoscaler 自动更新工作负载资源（例如 Deployment 或者 StatefulSet），目的是自动扩缩工作负载以满足需求。

水平扩缩意味着对增加的负载的响应是部署更多的 Pods。这与 “垂直（Vertical）” 扩缩不同，对于 Kubernetes，垂直扩缩意味着将更多资源（例如：内存或 CPU）分配给已经为工作负载运行的 Pod。

如果负载减少，并且 Pod 的数量高于配置的最小值， HorizontalPodAutoscaler 会指示工作负载资源（ Deployment、StatefulSet 或其他类似资源）缩减。

水平 Pod 自动扩缩不适用于无法扩缩的对象（例如：DaemonSet。）

HorizontalPodAutoscaler 被实现为 Kubernetes API 资源和控制器。

资源决定了控制器的行为。在 Kubernetes 控制平面内运行的水平 Pod 自动扩缩控制器会定期调整其目标（例如：Deployment）的所需规模，以匹配观察到的指标，例如，平均 CPU 利用率、平均内存利用率或你指定的任何其他自定义指标。

官方是这样给出的。

2.下载metrics

GitHUB地址

https://github.com/kubernetes-sigs/metrics-server

3.测试是否metrics是否正常运行，metrics正常运行。

kubectl top node

NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%

kubernetes-master01 183m 4% 1279Mi 21%

kubernetes-node01 49m 1% 1111Mi 18%

kubernetes-node02 39m 0% 369Mi 6%

4.创建测试应用

vim web.yaml

apiVersion: apps/v1

kind: Deployment

metadata:

labels:

app: web-nginx-hpa

name: web-deployment-nginx-test

namespace: default

spec:

replicas: 1

selector:

matchLabels:

app: web-nginx-hpa

template:

metadata:

labels:

app: web-nginx-hpa

spec:

containers:

- image: nginx

name: web-deployment-nginx-test

resources:

limits:

cpu: "50m"

memory: 20Mi

requests:

cpu: "50m"

memory: 20Mi

5.创建Serivce，这一步可以为前端提供一个访问入口。方便我们测试使用。

cat service-hpa.yaml

apiVersion: v1

kind: Service

metadata:

name: hpa-service

spec:

selector:

run: php-apache

ports:

name: http

port: 80

targetPort: 80

6.创建hpa资源

cat web.hpa.yaml

apiVersion: autoscaling/v1

kind: HorizontalPodAutoscaler

metadata:

name: web-deployment-nginx-test

spec:

scaleTargetRef:

apiVersion: apps/v1

kind: Deployment

name: web-deployment-nginx-test

minReplicas: 2 # 最小Pod数量

maxReplicas: 10 # 最大Pod数量

targetCPUUtilizationPercentage: 30 # CPU到百分之30使用扩缩容。

7.创建完毕后测试。

while :;do wget -q -O- http://nginx-hpa;done

8.随着不断访问，流量渐渐上来了。会触发扩缩容。

kubectl get hpa -w

NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE

web-deployment-nginx-test Deployment/web-deployment-nginx-test 0%/30% 2 10 2 90m

web-deployment-nginx-test Deployment/web-deployment-nginx-test 76%/30% 2 10 2 90m

web-deployment-nginx-test Deployment/web-deployment-nginx-test 76%/30% 2 10 4 91m

web-deployment-nginx-test Deployment/web-deployment-nginx-test 55%/30% 2 10 6 91m

web-deployment-nginx-test Deployment/web-deployment-nginx-test 50%/30% 2 10 6 91m

9.停止压测。因为默认情况下，每30s检测一次指标，只要检测到了配置HPA的目标值，则会计算出预期的工作负载的副本数，再进行扩缩容操作。同时，为了避免过于频繁的扩缩容，默认在5min内没有重新扩缩容的情况下，才会触发扩缩容。不过，HPA本身的算法相对比较保守，可能并不适用于很多场景。例如，一个快速的流量突发场景，如果正处在5min内的HPA稳定期，这个时候根据HPA的策略，会导致无法扩容。另外，在一些Serverless场景下，有缩容到0然后冷启动的需求，但HPA默认不支持。

kubectl get pod -w

web-deployment-nginx-test-54f8c5b657-c2wc4 1/1 Running 0 44m

web-deployment-nginx-test-54f8c5b657-c54w4 0/1 ContainerCreating 0 1s

web-deployment-nginx-test-54f8c5b657-cgf74 0/1 ContainerCreating 0 16s

web-deployment-nginx-test-54f8c5b657-k4mpc 0/1 ContainerCreating 0 1s

web-deployment-nginx-test-54f8c5b657-qv9f2 1/1 Running 0 16s

web-deployment-nginx-test-54f8c5b657-v5zfr 1/1 Running 0 3m4s

web-deployment-nginx-test-54f8c5b657-cgf74 1/1 Running 0 27s

kubernetes之HPA的更多相关文章

基于Custom-metrics-apiserver实现Kubernetes的HPA（内含踩坑）
前言这里要说一下Prometheus的检控指标从哪里来,它有3个渠道: 主机监控,也就是部署了Node Exporter组件的主机,它以DaemonSet或者系统进程的形式运行,Prometheus ...
基于Kubernetes的hpa实现pod实例数量的自动伸缩
Pod 是在 Kubernetes 体系中,承载用户业务负载的一种资源.Pod 们运行的好坏,是用户们最为关心的事情.在业务流量高峰时,手动快速扩展 Pod 的实例数量,算是玩转 Kubernetes ...
Kubernetes 弹性伸缩HPA功能增强Advanced Horizontal Pod Autoscaler -介绍部署篇
背景 WHAT(做什么) Advanced Horizontal Pod Autoscaler(简称:AHPA)是kubernetes中HPA的功能增强. 在兼容原生HPA功能基础上,增加预测.执行模 ...
Kubernetes（二）架构及资源关系简单总结
Kubernetes架构先引用一下官方的架构图: 对于本文来说,我觉得这张图有点复杂了,但是我又懒得自己画了,就用这张吧.Kubernetes是一个集群,和传统的集群相似,它也是有一个主节点和若干个 ...
Kubernetes之Pod使用
一.什么是Podkubernetes中的一切都可以理解为是一种资源对象,pod,rc,service,都可以理解是一种资源对象.pod的组成示意图如下,由一个叫”pause“的根容器,加上一个或多个 ...
kubernetes 降本增效标准指南| 容器化计算资源利用率现象剖析
作者:詹雪娇,腾讯云容器产品经理,目前主要负责腾讯云集群运维中心的产品工作. 张鹏,腾讯云容器产品工程师,拥有多年云原生项目开发落地经验.目前主要负责腾讯云TKE集群和运维中心开发工作. 引言降本增 ...
kubernetes 降本增效标准指南｜理解弹性，应用弹性
弹性伸缩在云计算领域的简述弹性伸缩又称自动伸缩,是云计算场景下一种常见的方法,弹性伸缩可以根据服务器上的负载.按一定的规则.进行弹性的扩缩容服务器. 弹性伸缩在不同场景下的含义: 对于服务运行在自建 ...
蚂蚁金服 Service Mesh 渐进式迁移方案|Service Mesh Meetup 实录
小蚂蚁说: 本文是基于在 Service Mesher Meetup 上海站的主题分享<蚂蚁金服 Service Mesh 渐进式迁移方案>内容整理,完整的分享 PPT 获取方式见文章底部 ...
k8s 应用优先级，驱逐，波动，动态资源调整
k8s 应用优先级,驱逐,波动,动态资源调整应用优先级 Requests 和 Limits 的配置除了表明资源情况和限制资源使用之外,还有一个隐藏的作用:它决定了 Pod 的 QoS 等级. 上一节 ...

随机推荐

Blazor Hybrid / MAUI 简介和实战
1. Blazor Blazor 是一个使用 .NET 生成交互式客户端 Web UI 的框架: 使用 C# 代替 JavaScript 来创建信息丰富的交互式 UI. 共享使用 .NET 编写的服务 ...
position与float
position:fixed/absolute和float的关系:元素设置position:absolute / fixed后,float属性是没有效果的.对于position: absolute元素 ...
django-rest-framework 基础三认证、权限和频率
django-rest-framework 基础三认证.权限和频率目录 django-rest-framework 基础三认证.权限和频率 1. 认证 1.1 登录接口 1.2 认证 2. 权限 ...
被迫开始学习Typescript —— interface
一开始以为,需要使用 class 来定义呢,学习之后才发现,一般都是使用 interface 来定义的. 这个嘛,倒是挺适合 js 环境的. 参考:https://typescript.bootcss ...
CSAPP 之 BombLab 详解
前言本篇博客将会展示 CSAPP 之 BombLab 的拆弹过程,粉碎 Dr.Evil 的邪恶阴谋.Dr.Evil 的替身,杀手皇后,总共设置了 6 个炸弹,每个炸弹对应一串字符串,如果字符串错误, ...
项目实战：Qt+OpenCV大家来找茬（Qt抓图，穿透应用，识别左右图区别，框选区别，微调位置）
前言本项目的出现理由只是笔者的一个念头,于是利用专业Qt和Opencv相关的知识开发一个辅助工具,本文章仅用于Qt和Opencv结合的学习. Demo演示效果运行包下载地 ...
ESP32+阿里云+vscode_Pio
用ESP32在vscode使用PlatformPIO写的代码.(代码是折叠代码,不能一眼瞧见,我也不太会使用编辑器哈,刚写博不久,望谅解.) 功能:esp32联网,能够通过联网打开在阿里云平台控制设备 ...
安装Tomcat到Linux（源码）
运行环境系统版本:CentOS Linux release 7.3.1611 软件版本:Tomcat-9.0.11 硬件要求:无安装过程 1.安装YUM-EPEL存储库 YUM-EPEL存储库由E ...
Python趣味入门9：函数是你走过的套路，详解函数、调用、参数及返回值
1.概念琼恩·雪诺当上守夜人的司令后,为训练士兵对付僵尸兵团,把成功斩杀僵尸的一系列动作编排成了"葵花宝典剑法",这就是函数.相似,在计算机世界,一系列前后连续的计算机语句组合在 ...
git实战-多分支开发-2022新项目
现在开发中大多数公司中都在使用Git这个代码版本管理工具,几乎可以说是已经成为标配,刚入职不久的这家新公司也不例外. 去公司没多久,开始搭建项目,然后创建开发分支,有多少个后端人员就创建多少个开发分支 ...

kubernetes之HPA

kubectl top node

kubectl get hpa -w

kubernetes之HPA的更多相关文章

随机推荐

热门专题