TIME_WAIT 优化

·【场景描述】

HTTP1.1之后，HTTP协议支持持久连接，也就是长连接，优点在于在一个TCP连接上可以传送多个HTTP请求和响应，减少了建立和关闭连接的消耗和延迟。

如果我们使用了nginx去作为反向代理或者负载均衡，从客户端过来的长连接请求就会被转换成短连接发送给服务器端。

为了支持长连接，我们需要在nginx服务器上做一些配置。

·【要求】

使用nginx时，想要做到长连接，我们必须做到以下两点：

从client到nginx是长连接
从nginx到server是长连接

对于客户端而言，nginx其实扮演着server的角色，反之，之于server，nginx就是一个client。

·【保持和 Client 的长连接】

我们要想做到Client与Nginx之间保持长连接，需要：

Client发送过来的请求携带"keep-alive"header。
Nginx设置支持keep-alive

【HTTP配置】

默认情况下，nginx已经开启了对client连接的 keepalive 支持。对于特殊场景，可以调整相关参数。

http {

keepalive_timeout 120s; #客户端链接超时时间。为0的时候禁用长连接。

keepalive_requests 10000; #在一个长连接上可以服务的最大请求数目。

#当达到最大请求数目且所有已有请求结束后，连接被关闭。

#默认值为100

}

大多数情况下，keepalive_requests = 100也够用，但是对于 QPS 较高的场景，非常有必要加大这个参数，以避免出现大量连接被生成再抛弃的情况，减少TIME_WAIT。

QPS=10000 时，客户端每秒发送 10000 个请求 (通常建立有多个长连接)，每个连接只能最多跑 100 次请求，意味着平均每秒钟就会有 100 个长连接因此被 nginx 关闭。

同样意味着为了保持 QPS，客户端不得不每秒中重新新建 100 个连接。

因此，如果用netstat命令看客户端机器，就会发现有大量的TIME_WAIT的socket连接 (即使此时keep alive已经在 Client 和 NGINX 之间生效)。

·【保持和Server的长连接】

想让Nginx和Server之间维持长连接，最朴素的设置如下：

http {

upstream backend {

server 192.168.0.1：8080 weight=1 max_fails=2 fail_timeout=30s;

server 192.168.0.2：8080 weight=1 max_fails=2 fail_timeout=30s;

keepalive 300; // 这个很重要！

}

server {

listen 8080 default_server;

server_name "";

location / {

proxy_pass http://backend;

proxy_http_version 1.1; # 设置http版本为1.1

proxy_set_header Connection ""; # 设置Connection为长连接（默认为no）}

}

【upstream配置】

upstream中，有一个参数特别的重要，就是keepalive。

这个参数和之前http里面的 keepalive_timeout 不一样。

这个参数的含义是，连接池里面最大的空闲连接数量。

不理解？没关系，我们来举个例子：

场景：

有一个HTTP服务，作为upstream服务器接收请求，响应时间为100毫秒。

要求性能达到10000 QPS，我们需要在nginx与upstream服务器之间建立大概1000条HTTP请求。（1000/0.1s=10000）

最优情况：

假设请求非常的均匀平稳，每一个请求都是100ms，请求结束会被马上放入连接池并置为idle（空闲）状态。

我们以0.1s为单位：

1. 我们现在keepalive的值设置为10，每0.1s钟有1000个连接

2. 第0.1s的时候，我们一共有1000个请求收到并释放

3. 第0.2s的时候，我们又来了1000个请求，在0.2s结束的时候释放

请求和应答都比较均匀，0.1s释放的连接正好够用，不需要建立新连接，且连接池中没有idle状态的连接。

第一种情况：

应答非常平稳，但是请求不平稳的时候

4. 第0.3s的时候，我们只有500个请求收到，有500个请求因为网络延迟等原因没有进来

这个时候，Nginx检测到连接池中有500个idle状态的连接，就直接关闭了（500-10）个连接

5. 第0.4s的时候，我们收到了1500个请求，但是现在池里面只有（500+10）个连接，所以Nginx不得不重新建立了（1500-510）个连接。

如果在第4步的时候，没有关闭那490个连接的话，只需要重新建立500个连接。

第二种情况：

请求非常平稳，但是应答不平稳的时候

4. 第0.3s的时候，我们一共有1500个请求收到

但是池里面只有1000个连接，这个时候，Nginx又创建了500个连接，一共1500个连接

5. 第0.3s的时候，第0.3s的连接全部被释放，我们收到了500个请求

Nginx检测到池里面有1000个idle状态的连接，所以不得不释放了（1000-10）个连接

造成连接数量反复震荡的一个推手，就是这个keepalive 这个最大空闲连接数。

上面的两种情况说的都是 keepalive 设置的不合理导致Nginx有多次释放与创建连接的过程，造成资源浪费。

keepalive 这个参数设置一定要小心，尤其是对于 QPS 要求比较高或者网络环境不稳定的场景，一般根据 QPS 值和 平均响应时间能大致推算出需要的长连接数量。

然后将keepalive设置为长连接数量的10%到30%。

【location配置】

http {

server {

location / {

proxy_pass http://backend;

proxy_http_version 1.1; # 设置http版本为1.1

proxy_set_header Connection ""; # 设置Connection为长连接（默认为no）

}

HTTP 协议中对长连接的支持是从 1.1 版本之后才有的，因此最好通过 proxy_http_version 指令设置为 1.1。

HTTP1.0不支持keepalive特性，当没有使用HTTP1.1的时候，后端服务会返回101错误，然后断开连接。

而 "Connection" header 可以选择被清理，这样即便是 Client 和 Nginx 之间是短连接，Nginx 和 upstream 之间也是可以开启长连接的。

【另外一种高级方式】

http {

map $http_upgrade $connection_upgrade {

default upgrade;

'' close;

}

upstream backend {

server 192.168.0.1：8080 weight=1 max_fails=2 fail_timeout=30s;

server 192.168.0.2：8080 weight=1 max_fails=2 fail_timeout=30s;

keepalive 300;

}

server {

listen 8080 default_server;

server_name "";

location / {

proxy_pass http://backend;

proxy_connect_timeout 15; #与upstream server的连接超时时间（没有单位，最大不可以超过75s）

proxy_read_timeout 60s; #nginx会等待多长时间来获得请求的响应

proxy_send_timeout 12s; #发送请求给upstream服务器的超时时间

proxy_http_version 1.1;

proxy_set_header Upgrade $http_upgrade;

proxy_set_header Connection $connection_upgrade;

}

http里面的map的作用是：

让转发到代理服务器的 "Connection" 头字段的值，取决于客户端请求头的 "Upgrade" 字段值。

如果 $http_upgrade没有匹配，那 "Connection" 头字段的值会是upgrade。

如果 $http_upgrade为空字符串的话，那 "Connection" 头字段的值会是 close。

【补充】

NGINX支持WebSocket。

对于NGINX将升级请求从客户端发送到后台服务器，必须明确设置Upgrade和Connection标题。

这也算是上面情况所非常常用的场景。

HTTP的Upgrade协议头机制用于将连接从HTTP连接升级到WebSocket连接，Upgrade机制使用了Upgrade协议头和Connection协议头。

为了让Nginx可以将来自客户端的Upgrade请求发送到后端服务器，Upgrade和Connection的头信息必须被显式的设置。

【注意】

在nginx的配置文件中，如果当前模块中没有proxy_set_header的设置，则会从上级别继承配置。

继承顺序为：http, server, location。

如果在下一层使用proxy_set_header修改了header的值，则所有的header值都可能会发生变化，之前继承的所有配置将会被丢弃。

所以，尽量在同一个地方进行proxy_set_header，否则可能会有别的问题。

·【参考】

Nginx中文官方文档： http://www.nginx.cn/doc/

测试参考文档： https://www.lijiaocn.com/问题/2019/05/08/nginx-ingress-keep-alive-not-work.html

keep-alive参考文档： https://wglee.org/2018/12/02/nginx-keepalive/

TIME_WAIT 优化的更多相关文章

TIME_WAIT 优化注意事项
不同时开启tcp_timestamps和tcp_tw_recycle的场景描述 FULL NAT下 FULL NAT 在client请求VIP 时,不仅替换了package 的dst ip,还替换了 ...
[web] 系统运维--单机
处理过程浏览器发送请求经过网络到达web服务器 web服务器处理请求并响应数据响应数据从web服务器发送到用户端用户浏览器接收数据,本地计算渲染指标响应时间吞吐量响应时间响应时间 = ...
减少TIME_WAIT时间的优化配置
减少TIME_WAIT时间的优化配置建立TCP需要三次握手才能建立,而断开连接则需要四次握手.整个过程如下图所示: net.ipv4.tcp_max_syn_backlog=8192 增加TCP S ...
linux 服务器优化 --TIME_WAIT 问题
linux 服务器优化 --TIME_WAIT 问题: 问题现象: 1.外部机器不能正常连接SSH 2.内向外不能够正常的ping通过,域名也不能正常解析. 通过一些命令,查看服务器TIME_WAIT ...
解决WEB（apache)服务器time_wait过高的性能优化过程
目录 1.网站的硬件环境 2.修改Httpd.conf 3.修改sysctl.conf文件一.网站环境LAMP硬件环境 [root@www conf]# dmidecode -s processor ...
nginx time_wait 较多优化
1. 查看命令 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 结果 ESTABLISHED 22 F ...
ubuntu系统TCP连接参数优化-TIME_WAIT过多解决办法
状态:描述CLOSED:无连接是活动的或正在进行LISTEN:服务器在等待进入呼叫SYN_RECV:一个连接请求已经到达,等待确认SYN_SENT:应用已经开始,打开一个连接ESTABLISHED:正 ...
MySQL优化聊两句
原文地址:http://www.cnblogs.com/verrion/p/mysql_optimised.html MySQL优化聊两句 MySQL不多介绍,今天聊两句该如何优化以及从哪些方面入手, ...
nginx--->高并发优化
在日常的运维工作中,经常会用到nginx服务,也时常会碰到nginx因高并发导致的性能瓶颈问题. nginx配置文件和内核参数的优化,如有不妥,敬请指出一.nginx的配置优化 1)nginx进程数 ...

随机推荐

WPF使用MVVM（三）-事件转命令
WPF使用MVVM(三)-事件转命令上一节介绍了WPF中的命令,可是仅仅介绍的是WPF框架给我们提供的点击命令,也就是用Command属性来绑定一个命令,用来响应按钮的点击行为!显然这是不够的,界面 ...
vmware启动后虚拟机无法联网
搜索services.msc打开服务确认VMware NAT service和VMware DHCP service服务处于启动状态:开启自动启动,下次就会自动联网了. VMware Authori ...
小谈C#泛型
(一)泛型的由来泛型是CLR2.0新增的,泛型兼具可重用性,类型安全和效率.泛型的本质就是在程序第一次编译的为IL代码的时候,就会帮我们生成一个占位符,在git即时编译的时候,就会把占位符替换为真实 ...
shell脚本编写自动启动服务方法
shell脚本编写自动启动服务方法前言 ln :创建连接文件默认创建的是硬连接,好比复制 ,但是两个文件会同步命令:ln ./java/android/aa.txt aaa s :创建的是软连接变 ...
-bash: ./1.sh: /bin/bash^M: bad interpreter: No such file or directory
1.开始以为是sh路径问题,用which查看是正确的. 2.用vim打开文件:vi 文件名. 3.按':'号键,输入查看文件的格式命令set ff或set fileformat. 4.可以看到格式是D ...
在Intellij IDEA中添加JUnit单元测试
Intellij IDEA中添加JUnit单元测试目录 Intellij IDEA中添加JUnit单元测试下载jar包在Intellij IDEA项目中添加jar包下载插件并进行设置创建存放 ...
VMware虚拟机三种网络模式
VMware三种网络模式在学习中经常遇到Vmware虚拟机网络设置有问题,可能是因为你没有理解这三种网络模式的工作原理.VMware虚拟机常见的网络类型有bridged(桥接).NAT(地址转换). ...
JZ-037-数字在排序数组中出现的次数
数字在排序数组中出现的次数题目描述统计一个数字在升序数组中出现的次数. 题目链接: 数字在排序数组中出现的次数代码 /** * 标题:数字在排序数组中出现的次数 * 题目描述 * 统计一个数字在 ...
从零开始Pytorch-YOLOv3【笔记】（一）配置文件解读
前言这是github上的一个项目YOLO_v3_tutorial_from_scratch,它还有相应的blog对其详细的解读.机器之心翻译了他的tutorial:从零开始PyTorch项目:YOL ...
NSView subview blocking drag/drop event
原文链接近期在Mac项目中有一个处理鼠标拖拽事件的需求, 大致处理流程是这样的: 从 NSView 继承得到一个子类覆盖处理拖拽事件相关方法注册拖拽事件开始的时候一切都很正常,直到某次发现拖拽 ...

TIME_WAIT 优化

TIME_WAIT 优化的更多相关文章

随机推荐

热门专题