TCP 连接关闭及TIME

这里主要记录一下TCP连接在关闭的时刻，有哪些细节问题。方便在以后的程序设计中能够注意这些细节，以避免出现这些错误。首先我们来看一下TCP的状态转换图。如《unix网络编程》卷一所示如下图：

TCP 四次挥手：

挥手时的序号问题
挥手过程中状态转换问题
TIME_WAIT 产生原因

挥手序号问题:

这里可以看出FIN也占用了一个序号，例如FIN M，对方回应ACK 确认序号为M+1。最后发送FIN也是如此。那么这里的M和N在传输数据过程中怎样得到的。看一下一个抓包的例子如下

::55.908193 IP localhost. > localhost.ospf-lite: Flags [P.], seq :, ack , win , length

::55.908606 IP localhost.ospf-lite > localhost.: Flags [P.], seq :, ack 236, win , length

::55.908703 IP localhost. > localhost.ospf-lite: Flags [.], ack , win , length

::00.029841 IP localhost. > localhost.ospf-lite: Flags [F.], seq 236, ack , win , length

::00.030176 IP localhost.ospf-lite > localhost.: Flags [F.], seq , ack , win , length

::00.030225 IP localhost. > localhost.ospf-lite: Flags [.], ack , win , length

这里可以清楚的看到发送FIN的序列号正是真实已经确认数据的序列号的下一个序号。FIN也占用一个序列号，所以FIN的ACK序号也是加一。

挥手过程中状态转换问题

这里有两个测试程序如下：

 #!/usr/bin/env python

 # coding: utf-8

 import socket

 import os

 import sys

 import time

 def main(argv):

     host = (argv[1], int(argv[2]))

     filename = argv[3]

     fd = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

     try:

         fd.connect(host)

     except socket.error, e:

         print e

         sys.exit(0)

     fp = open(filename,'rb')

     while True:

         buff = fp.read(2048)

         if  buff:

             fd.send(buff)

         else:

              break

 if __name__ == '__main__':

     if len(sys.argv) != 4:

         print "Like client.py 192.168.1.100 6666 a.dd"

         sys.exit(0)

     main(sys.argv)

 #!/usr/bin/env python

 # coding: utf-8

 import socket

 import os

 import sys

 import time

 def main(port):

     fd = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

     host = socket.gethostname()

     fd.bind((host, port))

     fd.listen(10)

     while True:

         clifd, addr = fd.accept()

         print 'Client address : ', addr

         while True:

             time.sleep(30)

             data =  clifd.recv(1024)

             if data:

                 print data

             else:#读取到0 连接断开要60s

                 print "client closed"

                 clifd.close()

                 break

 if __name__ == '__main__':

     port = 8888

     main(port)

一个客户端另一个是服务器端。

1. 首先在服务器接受连接后就进入等待，客户端连接完成后就将数据全部发送并关闭连接程序退出抓包结果如下：

::11.825971 IP cps. > cps.ddi-tcp-: Flags [S], seq , win , options [mss ,sackOK,TS val  ecr ,nop,wscale ], length

::05.598183 IP cps.ddi-tcp- > cps.: Flags [S.], seq , ack , win , options [mss ,sackOK,TS val  ecr ,nop,wscale ], length

::11.826052 IP cps. > cps.ddi-tcp-: Flags [.], ack , win , options [nop,nop,TS val  ecr ], length

::11.826159 IP cps. > cps.ddi-tcp-: Flags [P.], seq :, ack , win , options [nop,nop,TS val  ecr ], length

::11.826170 IP cps.ddi-tcp- > cps.: Flags [.], ack , win , options [nop,nop,TS val  ecr ], length

::11.826193 IP cps. > cps.ddi-tcp-: Flags [F.], seq , ack , win , options [nop,nop,TS val  ecr ], length

::11.865650 IP cps.ddi-tcp- > cps.: Flags [.], ack , win , options [nop,nop,TS val  ecr ], length

在服务器暂停的30s内已经收到了客户端发送的数据和FIN 并都得到了确认。再看一下连接状态

tcp               192.168.24.126:     0.0.0.0:*               LISTEN

tcp               192.168.24.126:    192.168.24.126:     FIN_WAIT2  客户端的状态

tcp             192.168.24.126:     192.168.24.126:    CLOSE_WAIT

这里看到即使程序退出 FIN-WAIT1 FIN-WAIT2 TIME-WAIT这三种状态也不会消失它们是由内核维护，有相关定时器控制。如这里的FIN-WAIT2状态超时后就不再进入TIME-WAIT 这时对端再回复FIN时就会回应RST。若在超时时间内则正常回应并彻底断开连接。

FIN-WAIT2超时
17::18.401858 IP cps. > cps.ddi-tcp-: Flags [P.], seq :, ack , win , options [nop,nop,TS val  ecr ], length

::18.401872 IP cps.ddi-tcp- > cps.: Flags [.], ack , win , options [nop,nop,TS val  ecr ], length

::18.401905 IP cps. > cps.ddi-tcp-: Flags [F.], seq , ack , win , options [nop,nop,TS val  ecr ], length

::18.441595 IP cps.ddi-tcp- > cps.: Flags [.], ack , win , options [nop,nop,TS val  ecr ], length

::18.474816 IP cps.ddi-tcp- > cps.: Flags [F.], seq , ack , win , options [nop,nop,TS val  ecr ], length

::18.474871 IP cps. > cps.ddi-tcp-: Flags [R], seq , win , length 0   FIN-WAIT2 超时消失后发送FIN 得到RST

2. FIN_WAIT_1 状态：假如当主动方close时，发送FIN给对方，但是在这个过程中一直没有收到来自对方对FIN的确认，那么主动方就会重传一定时间的FIN，当超时后就会放弃，然后不经过TIME_WAIT 直接清理缓存断开连接。可以参考： http://www.cnblogs.com/MaAce/p/8039119.html

3. 主动方close之后，对方还有数据在发送并在路上时：这种情况也是常常发生，主动方close掉连接，就是把读写全部关闭并把发送缓冲区的全部数据一次性发送到对端。那么这时如果有对方发送的数据包在路上时，当数据包达到时，刚好close已返回，那么这时主动断开的一方就会发送rst给对方。这时可以用shutdown来替换close来获取最后接收的内容。关闭时仅仅关闭写端，然后再继续read直到读到0为止表示收到对端的fin。当不确定关闭时还有没有未接收的数据可以这样使用。这里可以确保接收完整直到收到断开信息保证了对方应用进程已经读取了我们的数据。但这里要注意的是shutdown写端会把发送缓冲区清空。

//类似这样

shutdown(fd, FD_WR);

while()

{

    if(read() == )

    {

        break;

    }

}

4. close关闭连接后默认情况下是立即返回以后就不再接收和发送普通数据若发送缓冲区有数据就把数据一次性发送到对端。这里有可能并没有收到对方的对数据和FIN 的确认，然而close已返回。这里可以设置套接字属性SO_LINGER 延迟关闭来确保收到对方的确认信息在一定时间内收到了确认则close 返回成功。如果在延时时间内并未收到来自对端的确认，那么close就会返回错误EWOULDBLOCK 如下图：。这里还要注意此时对于非阻塞而言，直接返回错误EWOULDBLOCK。所以验证close的返回值是很有必要的。至于so_linger的用法网上例子很多： http://blog.csdn.net/factor2000/article/details/3929816

如果发送缓冲区的数据没有发送完毕或者没有收到对端确认，close就返回，内核就放弃没有发送的数据或是不再等待B端的确认，直接发送RST复位连接不进入TIME_WAIT状态。

TIME_WAIT 状态

由以上可知，即使程序退出，内核也会帮其维护timewait的定时器。维持这个状态的原因如下：

1. 假设最终的ACK丢失，server将重发FIN，client必须维护TCP状态信息以便可以重发最终的ACK，否则会发送RST，结果server认为发生错误。TCP实现必须可靠地终止连接的两个方向(全双工关闭)，client必须进入 TIME_WAIT 状态，因为client可能面 临重发最终ACK的情形。

2. 如果 TIME_WAIT 状态保持时间不足够长(比如小于2MSL)，第一个连接就正常终止了。 第二个拥有相同相关五元组的连接出现，而第一个连接的重复报文到达，干扰了第二 个连接。TCP实现必须防止某个连接的重复报文在连接终止后出现，所以让TIME_WAIT 状态保持时间足够长(2MSL)，连接相应方向上的TCP报文要么完全响应完毕，要么被 丢弃。建立第二个连接的时候，不会混淆。

Linux下我们可以设置时检查一下time和wait的值

#sysctl -a | grep time | grep wait

net.ipv4.netfilter.ip_conntrack_tcp_timeout_time_wait =

net.ipv4.netfilter.ip_conntrack_tcp_timeout_close_wait =

net.ipv4.netfilter.ip_conntrack_tcp_timeout_fin_wait =

处于timewait时内核并不会把他的相关结构清空。

其中套接字选项中还有地址和端口重用的选项SO_REUSEADDR和SO_REUSEPORT 这两个选项就是为了避免server 重启时端口忙的问题。

这个套接字选项通知内核，如果端口忙，但TCP状态位于 TIME_WAIT ，可以重用端口。如果端口忙，而TCP状态位于其他状态，重用端口时依旧得到一个错误信息，指明"地址已经使用中"。如果你的服务程序停止后想立即重启，而新套接字依旧使用同一端口，此时 SO_REUSEADDR 选项非常有用。必须意识到，此时任何非期望数据到达，都可能导致服务程序反应混乱，不过这只是一种可能，事实上很不
可能。

TCP 连接关闭及TIME_WAIT探究的更多相关文章

socket使用TCP协议时，send、recv函数解析以及TCP连接关闭的问题
Tcp协议本身是可靠的,并不等于应用程序用tcp发送数据就一定是可靠的.不管是否阻塞,send发送的大小,并不代表对端recv到多少的数据. 在阻塞模式下, send函数的过程是将应用程序请求发送的数 ...
[转]socket使用TCP协议时，send、recv函数解析以及TCP连接关闭的问题
Tcp协议本身是可靠的,并不等于应用程序用tcp发送数据就一定是可靠的.不管是否阻塞,send发送的大小,并不代表对端recv到多少的数据. 在阻塞模式下, send函数的过程是将应用程序请求发送的数 ...
TCP连接关闭总结
由于涉及面太广,只作简单整理,有兴趣的可参考<UNIX Networking Programming>volum 1, Section 5.7, 5.12, 5.14, 5.15, 6.6 ...
TCP 连接中的TIME_WAIT
原文:http://blog.csdn.net/wangpengqi/article/details/17245349 这就有个细节,一次http请求,谁会先断开TCP连接?什么情况下客户端先断,什么 ...
tcp连接的状态变迁以及如何调整tcp连接中处于time_wait的时间
一.状态变迁图二.time_wait状态针对time_wait和close_wait有个简单的描述帮助理解: Due to the way TCP/IP works, connections ca ...
socket 连接关闭的TIME_WAIT状态的理由
MSL就是maximum segment lifetime(最大分节生命期),这是一个IP数据包能在互联网上生存的最长时间,超过这个时间将在网络中消失 TIME_WAIT两点原因: 1.TCP分节可能 ...
Linux 内核协议栈之TCP连接关闭
Close行为: 当应用程序在调用close()函数关闭TCP连接时,Linux内核的默认行为是将套接口发送队列里的原有数据(比如之前残留的数据)以及新加入的数据(比如函数close()产生的FIN ...
ubuntu系统TCP连接参数优化-TIME_WAIT过多解决办法
状态:描述CLOSED:无连接是活动的或正在进行LISTEN:服务器在等待进入呼叫SYN_RECV:一个连接请求已经到达,等待确认SYN_SENT:应用已经开始,打开一个连接ESTABLISHED:正 ...
TCP连接的建立与关闭
TCP是主机对主机层的传输控制协议:建立连接要三个握手,断开连接要四次挥手. 位码即TCP标志位,有6种标示:SYN(synchronous建立联机),ACK(acknowledgement 确认), ...

随机推荐

iOS 点击屏幕空白区隐藏键盘方法
iOS开发中,经常要用到输入框,可默认情况下,输入框出来之后,除非点击键盘上面的“Done”或“Next”按钮才能将其隐藏.站在用户体验的角度上看,这种情况很不友好,尤其是不能突显苹果操作的便捷性. ...
nyoj61 传纸条（一） dp
思路:两人一个从左上角出发只能向右和向下,另一人从右下角出发只能向左和向上,可以看做两人都是从右下角出发,且只能向左和向上传纸条,并且两条路径不会相交,因为一个人只会传一次,那么随便画一个图就能知道两 ...
UVa230 Borrowers
原题链接 UVa230 思路这题输入时有一些字符串处理操作,可以利用string的substr()函数和find_last_of()函数更加方便,处理时不必更要把书名和作者对应下来,注意到原题书名的 ...
王垠：我和Google的故事
也许有人看见过我批判 Google 的那篇英文文章.它好像有一部分片面性,所以被我从英文博客上拿下来了.我一直在反思自己在 Google 的经历,因为在这个公司工作总是感觉不对劲,但是却总也说不清楚为 ...
SpringCloud入门1-服务注册与发现(Eureka)
前言 Oracle转让Java,各种动态语言的曝光率上升,Java工程师的未来在哪里?我觉得Spring Cloud让未来有无限可能.拖了半年之久的Spring Cloud学习就从今天开始了.中文教材 ...
关于.Net的知识和相关书籍
a. DBCC DROPCLEANBUFFERS 清空缓存信息b. DBCC FREEPROCCACHE 从过程缓存中删除所有元素2. 引用两个和尚打水的故事,说明平时要注重积累,只有量变达到了才会形 ...
Git 用户名和邮箱
用户名邮箱的作用用户名和邮箱地址是本地git客户端的一个变量,不随git库而改变. 每次commit都会用用户名和邮箱纪录. github的contributions统计就是按邮箱来统计的. 查看用 ...
ul 和 ol 标签的相关设置
初学者不喜欢 ul 标签的最重要一点莫过于其前面的黑点了,每次写个无序列表其前面总有一个黑点是个很讨厌的事,去掉黑点的话自然是要用到 list-style:none:这条css 属性设置了. p.p1 ...
js获取当前浏览器地址栏的链接，然后在链接后面加参数
比如访问www.baidu.com,url显示成www.baidu.com/?form <script type="text/javascript"> if(locat ...
ffmpeg结构体以及函数介绍（一）
本文对在使用ffmpeg进行音视频编解码时使用到的一些函数做一个简单介绍,我当前使用的ffmpeg版本为:0.8.5,因为本人发现在不同的版本中,有些函数名称会有点小改动,所以在此有必要说明下ffmp ...

TCP 连接关闭及TIME_WAIT探究

TCP 连接关闭及TIME_WAIT探究的更多相关文章

随机推荐

热门专题