K8S 性能优化 - OS sysctl 调优

前言

K8S 性能优化系列文章，本文为第一篇：OS sysctl 性能优化参数最佳实践。

参数一览

sysctl 调优参数一览

# Kubernetes Settings

vm.max_map_count = 262144

kernel.softlockup_panic = 1

kernel.softlockup_all_cpu_backtrace = 1

net.ipv4.ip_local_reserved_ports = 30000-32767

# Increase the number of connections

net.core.somaxconn = 32768

# Maximum Socket Receive Buffer

net.core.rmem_max = 16777216

# Maximum Socket Send Buffer

net.core.wmem_max = 16777216

# Increase the maximum total buffer-space allocatable

net.ipv4.tcp_wmem = 4096 87380 16777216

net.ipv4.tcp_rmem = 4096 87380 16777216

# Increase the number of outstanding syn requests allowed

net.ipv4.tcp_max_syn_backlog = 8096

# For persistent HTTP connections

net.ipv4.tcp_slow_start_after_idle = 0

# Allow to reuse TIME_WAIT sockets for new connections

# when it is safe from protocol viewpoint

net.ipv4.tcp_tw_reuse = 1

# Max number of packets that can be queued on interface input

# If kernel is receiving packets faster than can be processed

# this queue increases

net.core.netdev_max_backlog = 16384

# Increase size of file handles and inode cache

fs.file-max = 2097152

# Max number of inotify instances and watches for a user

# Since dockerd runs as a single user, the default instances value of 128 per user is too low

# e.g. uses of inotify: nginx ingress controller, kubectl logs -f

fs.inotify.max_user_instances = 8192

fs.inotify.max_user_watches = 524288

# Additional sysctl flags that kubelet expects

vm.overcommit_memory = 1

kernel.panic = 10

kernel.panic_on_oops = 1

# Prevent docker from changing iptables: https://github.com/kubernetes/kubernetes/issues/40182

net.ipv4.ip_forward=1

如果是 AWS，额外增加如下：

# AWS settings

# Issue #23395

net.ipv4.neigh.default.gc_thresh1=0

如果启用了 IPv6，额外增加如下：

# Enable IPv6 forwarding for network plugins that don't do it themselves

net.ipv6.conf.all.forwarding=1

参数解释

分类	内核参数	说明	参考链接
Kubernetes	`vm.max_map_count = 262144`	限制一个进程可以拥有的VMA(虚拟内存区域)的数量，一个更大的值对于 elasticsearch、mongo 或其他 mmap 用户来说非常有用	ES Configuration
Kubernetes	`kernel.softlockup_panic = 1`	用于解决 K8S 内核软锁相关 bug	root cause kernel soft lockups · Issue #37853 · kubernetes/kubernetes (github.com)
Kubernetes	`kernel.softlockup_all_cpu_backtrace = 1`	用于解决 K8S 内核软锁相关 bug	root cause kernel soft lockups · Issue #37853 · kubernetes/kubernetes (github.com)
Kubernetes	`net.ipv4.ip_local_reserved_ports = 30000-32767`	默认 K8S Nodport 端口	service-node-port-range and ip_local_port_range collision · Issue #6342 · kubernetes/kops (github.com)
网络	`net.core.somaxconn = 32768`	表示socket监听（listen）的backlog上限。什么是backlog？backlog就是socket的监听队列，当一个请求（request）尚未被处理或建立时，他会进入backlog。增加连接数.	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.core.rmem_max = 16777216`	接收套接字缓冲区大小的最大值(以字节为单位)。最大化 Socket Receive Buffer	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.core.wmem_max = 16777216`	发送套接字缓冲区大小的最大值(以字节为单位)。最大化 Socket Send Buffer	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	net.ipv4.tcp_wmem = 4096 87380 16777216 net.ipv4.tcp_rmem = 4096 87380 16777216	增加总的可分配的 buffer 空间的最大值	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.ipv4.tcp_max_syn_backlog = 8096`	表示那些尚未收到客户端确认信息的连接（SYN消息）队列的长度，默认为1024 增加未完成的syn请求的数量	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.ipv4.tcp_slow_start_after_idle = 0`	持久化 HTTP 连接	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.ipv4.tcp_tw_reuse = 1`	表示允许重用TIME_WAIT状态的套接字用于新的TCP连接,默认为0，表示关闭。允许在协议安全的情况下重用TIME_WAIT 套接字用于新的连接	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.core.netdev_max_backlog = 16384`	当网卡接收数据包的速度大于内核处理的速度时，会有一个队列保存这些数据包。这个参数表示该队列的最大值如果内核接收数据包的速度超过了可以处理的速度，这个队列就会增加	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
文件系统	`fs.file-max = 2097152`	该参数决定了系统中所允许的文件句柄最大数目，文件句柄设置代表linux系统中可以打开的文件的数量。增加文件句柄和inode缓存的大小	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
文件系统	fs.inotify.max_user_instances = 8192 fs.inotify.max_user_watches = 524288	一个用户的inotify实例和watch的最大数量由于dockerd作为单个用户运行，每个用户的默认实例值128太低了例如使用inotify: nginx ingress controller, kubectl logs -f	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
kubelet	`vm.overcommit_memory = 1`	对内存分配的一种策略 =1，表示内核允许分配所有的物理内存，而不管当前的内存状态如何	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
kubelet	`kernel.panic = 10`	panic错误中自动重启，等待时间为10秒	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
kubelet	`kernel.panic_on_oops = 1`	在Oops发生时会进行panic()操作	Image: We should tweak our sysctls · Issue #261 · kubernetes-retired/kube-deploy (github.com)
网络	`net.ipv4.ip_forward=1`	启用ip转发另外也防止docker改变iptables	Upgrading docker 1.13 on nodes causes outbound container traffic to stop working · Issue #40182 · kubernetes/kubernetes (github.com)
网络	`net.ipv4.neigh.default.gc_thresh1=0`	修复 AWS `arp_cache: neighbor table overflow!` 报错	arp_cache: neighbor table overflow! · Issue #4533 · kubernetes/kops (github.com)

EOF

三人行, 必有我师; 知识共享, 天下为公. 本文由东风微鸣技术博客 EWhisper.cn 编写.

K8S 性能优化 - OS sysctl 调优的更多相关文章

性能优化之MySQL调优篇
MySQL对于很多Linux从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰.在进行MySQL的优化之前必须要了解的就是MySQL的查询过程,很多的查询优化工作 ...
（转）Spark性能优化：资源调优篇
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何 ...
【转载】 Spark性能优化：资源调优篇
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置 ...
Spark性能优化：资源调优篇（转）
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置 ...
Spark性能优化--数据倾斜调优与shuffle调优
一.数据倾斜发生的原理原理:在进行shuffle的时候,必须将各个节点上相同的key拉取到某个节点上的一个task来进行处理,比如按照key进行聚合或join等操作.此时如果某个key对应的数据量特 ...
Spark性能优化：shuffle调优
调优概述大多数Spark作业的性能主要就是消耗在了shuffle环节,因为该环节包含了大量的磁盘IO.序列化.网络数据传输等操作.因此,如果要让作业的性能更上一层楼,就有必要对shuffle过程进行 ...
Spark性能优化：资源调优篇
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置 ...
Spark性能优化：开发调优篇
1.前言在大数据计算领域,Spark已经成为了越来越流行.越来越受欢迎的计算平台之一.Spark的功能涵盖了大数据领域的离线批处理.SQL类处理.流式/实时计算.机器学习.图计算等各种不同类型的计算 ...
SQL优化（SQL TUNING）之10分钟完成亿级数据量性能优化（SQL调优）
前几天,一个用户研发QQ找我,如下: 自由的海豚. 16:12:01 岛主,我的一条SQL查不出来结果,能帮我看看不? 兰花岛主 16:12:10 多久不出结果? 自由的海豚 16:12:17 多久都 ...
SQL优化（SQL TUNING）之10分钟完毕亿级数据量性能优化（SQL调优）
前几天.一个用户研发QQ找我,例如以下: 自由的海豚. 16:12:01 岛主,我的一条SQL查不出来结果,能帮我看看不? 兰花岛主 16:12:10 多久不出结果? 自由的海豚 16:12:17 多 ...

随机推荐

Mybatis实现树状结构查询
1.实体类 @Data public class CourseChapterVO implements Serializable { private static final long serialV ...
SQL Server创建表，存储过程，function函数脚本规范
--创建新表 /**************************************************************************************** *** ...
JAVA-批量下载zip
案例一 @ApiOperation(value = "根据id 批量下载文件", notes = "根据id 批量下载文件") @RequestMapping( ...
记一次前端ajax禁止使用异步async的操作
环境: 前端layui jquery 情况: 页面在iframe里面, 然后点击按钮,弹出输入框.点击确认,弹出框发送内容到后台, 传送数据到后台后,然后根据返回一个map给前端.前端解析数据,返回 ...
使用Latex错误集
1.写公式的函数--align(最怕空行) (1)align用法示例 \begin{align} & \left\{ \begin{array}{ll} \sup\limits_{\tilde ...
nuxt中asyncData和fetch的区别
asyncData作用于页面pages,在组件中不能使用,并且asyncData中没有this,如果想要给data中的数据赋值,要在asyncData函数中return出去 fetch 作用于组件中c ...
Java基础Day5-数组
一.数组声明创建首先必须声明数组变量,才能在程序中使用数组. 声明数组变量的语法如下: dataType[] arrayRefVar; 例如: int[] nums; Java语言使用new操作符来 ...
python-sqlite数据库锁定
sqlite3.OperationalError: database is locked 因为sqlite只支持单线程操作,如果此时打开数据库就会出现这个问题
解决黑苹果macOS Monterey系统无法正常睡眠、睡眠无法唤醒，唤醒后显示器无输出问题
1.解决无法睡眠问题:添加睡眠补丁:HibernationFixup.kext, 或者添加ssdt:ssdt-GPRW.aml,并在ACPI补丁中添加热补丁: 2.解决睡眠后无法唤醒.唤醒后显示器无输 ...
20181224蒋嘉豪-exp4
20181224蒋嘉豪-exp4 目录 20181224蒋嘉豪-exp4 实验概况 1.实践目标 2.实践内容概述知识点总结 1.有关schtasks 2.有关Sysmon(参考链接) 3.恶意代码 ...

K8S 性能优化 - OS sysctl 调优

前言

参数一览

参数解释

K8S 性能优化 - OS sysctl 调优的更多相关文章

随机推荐

热门专题