一、Cork算法概述

Cork算法与Nagle算法类似,也有人把Cork算法称呼为super-Nagle。Nagle算法提出的背景是网络因为大量小包小包而导致利用率低下产生网络拥塞,网络发生拥塞的时候性能还会进一步下降,因此Nagle算法通过ACK确认包来触发新数据包的发送(ACK确认包意味着对端已经接收到了一个数据包,即有一个数据包已经离开中间网络,此时可以在向中间网络注入一个数据包块,这称呼为self-clocking)。Cork算法则更为激进,一旦打开Cork算法,TCP不关注是否有收到ACK报文,只要当前缓存中累积的数据量不足以组成一个full-sized数据包就不会将数据包发出,直到一个RTO超时后才会把不满足一个full-sized的数据包发出去(实际上是通过一个persist timer来设置的这个RTO定时时间,persist timer超时的时候就会强制发送)。

linux中可以通过TCP_CORK选项来设置socket打开Cork算法。TCP_NODELAY选项和TCP_CORK选项在linux早期版本是互斥的,但目前最新的linux版本已经可以同时打开这两个选项了,但是TCP_CORK选项的优先级要比TCP_NODELAY选项的优先级要高。

二、wireshark示例

下面我们看几个wireshark的示例对进一步理解cork算法,同时要注意和前面Nagle的示例对比。下面的示例中同样设置client侧通过SYN包通告MSS为(50+12)bytes,server端扣除12bytes的TSopt选项后(包含两个nop选项),最大只能发送50bytes的数据包了。

1、Cork算法打开,Nagle算法默认打开

如下图所示,client与serve端建立TCP连接后,server端立即写入8bytes的数据,接着休眠5s然后写入105bytes的数据。

server端写入的8bytes数据在No4报文中发送,但是可以看到No3并没有在No3后立即发送,原因就是此时Cork算法处于打开状态,此时累计缓存不满足一个mss,因此不会立即发送,但是server端会在write写入数据的时候启动一个定时器,定时器定时时间为RTO,从server端程序中可以获取到当前RTO为2.104s,可以看到No3和No4之间的时间差差不多就是2.104s。最终这个定时器超时,发出了No4数据包。接着写入的105bytes数据,因此前100byte可以组成两个full-sized的数据包,因此会立即发出,对应No6和No7数据包。最后的5bytes数据直到No10采发出。同样server端在接收到No9的ACK报文的时候,发现当前没有已经发出去的还没被ACK数据,而缓存中还有数据因为窗口限制或者Cork限制等原因没有发出去,那么同样会启动刚刚那个定时器,超时时间为RTO,此时从server端程序中可以获取当前的RTO为1.968s,可以看到这个时间间隔与No9和No10之间的时间间隔基本相同。

2、Cork算法关闭,Nagle算法默认打开

关闭Cork算法,重新运行示例1的测试程序,结果如下,不再赘述,请自行与上面的wireshark截图对比

3、Cork算法与Nagle算法交互

上面我们说过TCP_CORK选项的优先级要比TCP_NODELAY选项的优先级要高(注意TCP_NODELAY是关闭Nagle算法),下面我们来看一个示例。

  • 如下图所示,server端建立连接后,先设置TCP_CORK选项打开,然后应用层连续写入两次,每次写入8bytes,可以从下图中看到server端写入的数据受限于Cork算法并没有立即发出。

  • 接着休眠200ms后,在打开TCP_NODELAY选项后,可以看到No4处的报文立即发出了(No4和No3正好大约相差200ms),原因是虽然TCP_NODELAY选项的优先级比TCP_CORK优先级低,但是这个只对设置TCP_NODELAY后的应用层写入生效,在开始设置TCP_NODELAY选项的时候会尝试忽略Cork算法而将缓存中的数据全部发出。

  • 打开TCP_NODELAY后,server端应用层立即写入两次,每次写入8bytes的数据。可以看到虽然打开了TCP_NODELAY,但是这两次写入并没有立即以两个数据包发出。

  • 接着server休眠200ms后写入50bytes的数据,此时已经可以组成一个full-sized数据包了,满足Cork算法发包条件,可以看到server端立即发出了No6数据包。可以看到No6和No4大约间隔200ms。

  • server端在收到No7的数据包后,发现当前没有已经发出的还没被ACK确认的数据包,但是缓存中还有因为Cork算法而不能发出的数据包,因此设置persist timer定时器,定时时间为RTO,从server端程序可以获取此时的RTO为2.016s。

  • 定时器超时后,最后的16bytes数据包忽略Cork算法的限制被server端强制发出,对应No8数据包。可以看到No8数据包与No7数据包大约相隔2.019s,与之前的定时器定时时间基本相符。

补充资料:

1、http://stackoverflow.com/questions/22124098/is-there-any-significant-difference-between-tcp-cork-and-tcp-nodelay-in-this-use

2、http://ccr.sigcomm.org/archive/2001/jan01/ccr-200101-mogul.pdf

TCP系列30—窗口管理&流控—4、Cork算法的更多相关文章

  1. TCP系列27—窗口管理&流控—1、概述

    在前面的内容中我们依次介绍了TCP的连接建立和终止过程和TCP的各种重传方式.接着我们在这部分首先关注交互式应用TCP连接相关内容如延迟ACK.Nagle算法.Cork算法等,接着我们引入流控机制(f ...

  2. TCP系列31—窗口管理&流控—5、TCP流控与滑窗

    一.TCP流控 之前我们介绍过TCP是基于窗口的流量控制,在TCP的发送端会维持一个发送窗口,我们假设发送窗口的大小为N比特,网络环回时延为RTT,那么在网络状况良好没有发生拥塞的情况下,发送端每个R ...

  3. TCP系列32—窗口管理&流控—6、TCP zero windows和persist timer

    一.简介 我们之前介绍过,TCP报文中的window size表示发出这个报文的一端准备多少bytes的数据,当TCP的一端一直接收数据,但是应用层没有及时读取的话,数据一直在TCP模块中缓存,最终受 ...

  4. TCP系列36—窗口管理&流控—10、linux下的异常报文系列接收

    在这篇文章中我们看一下server端在接收到异常数据系列时的处理,主要目的是通过wireshark示例对这些异常数据系列的处理有一个直观的认识,感兴趣的自行阅读相关代码和协议,这里不再进行详细介绍 在 ...

  5. TCP系列35—窗口管理&流控—9、紧急机制

    一.概述 我们在最开始介绍TCP头结构的时候,里面有个URG的标志位,还有一个Urgent Pointer的16bits字段.当URG标志位有效的时候,Urgent Poinert用来指示紧急数据的相 ...

  6. TCP系列33—窗口管理&流控—7、Silly Window Syndrome(SWS)

    一.SWS介绍 前面我们已经通过示例看到如果接收端的应用层一直没有读取数据,那么window size就会慢慢变小最终可能变为0,此时我们假设一种场景,如果应用层读取少量数据(比如十几bytes),接 ...

  7. TCP系列34—窗口管理&流控—8、缓存自动调整

    一.概述 我们之前介绍过一种具有大的带宽时延乘积(band-delay product.BDP)的网络,这种网络称为长肥网络(LongFatNetwork,即LFN).我们想象一种简单的场景,假设发送 ...

  8. TCP系列29—窗口管理&流控—3、Nagle算法

    一.Nagle算法概述 之前我们介绍过,有一些交互式应用会传递大量的小包(称呼为tinygrams),这些小包的负载可能只有几个bytes,但是TCP和IP的基本头就有40bytes,如果大量传递这种 ...

  9. TCP系列28—窗口管理&流控—2、延迟ACK(Delayed Acknowledgments)

    一.简介 之前的内容中我们多次提到延迟ACK(Delayed Ack),延迟ACK是在RFC1122协议中定义的,协议指出,一个TCP实现应该实现延迟ACK,但是ACK不能被过度延迟,协议给出延迟AC ...

随机推荐

  1. Hbase 表的Rowkey设计避免数据热点

    一.案例分析 常见避免数据热点问题的处理方式有:加盐.哈希.反转等方法结合预分区使用. 由于目前原数据第一字段为时间戳形式,第二字段为电话号码,直接存储容易引起热点问题,通过加随机列.组合时间戳.字段 ...

  2. ubuntu16.04 64位安装tftp服务器

    1.安装tftpd-hpa和xinetd sudo apt-get install tftpd-hpa xined2.针对64位操作系统安装openbsd-inetd apt-get install ...

  3. 在window10平台下安装TensorFlow(only cpu)

    这是我在安装tensorflow遇到的问题记录 希望可以给大家一些帮助(2019年1月6日) 1. 需要安装的环境及软件 python3.6 Anaconda Tensorflow 2. 先安装ana ...

  4. 小程序开发-9-Behavior行为与加入缓存系统优化流行页面

    Behavior行为与加入缓存系统优化流行页面 navi组件与移动端触碰区域探讨 触碰区域优化 设计师切图切大点,多余部分变成透明色 前端将可触碰区域变大 解决向左箭头变灰,向右变灰 禁用事件的技巧 ...

  5. 【EXCEL】XMLファイルを開く方法(XML文件打开方法)

    前言 XMLとは:Extensible Markup Language(エクステンシブル マークアップ ランゲージ)は.基本的な構文規則を共通とすることで.任意の用途向けの言語に拡張することを容易とし ...

  6. war2 洛谷模拟赛day2 t3 状压

    (new )   war2 题解:总体数据而言,我们很容易想到着就是DP啊,我们DP数组,用状态压缩,代表有那些点已经被占领过了,代表上一次我占的是那个.对于每一次状态转移,若当前我们要占领的Port ...

  7. 苏州Uber优步司机奖励政策(12月21日到12月27日)

    滴快车单单2.5倍,注册地址:http://www.udache.com/ 如何注册Uber司机(全国版最新最详细注册流程)/月入2万/不用抢单:http://www.cnblogs.com/mfry ...

  8. pg 与 oracle 比较

    所谓动态引擎,就是说比如有很多张表的Join,原始的做法是一开始就生成好这个执行计划,随后执行,但实际上很多表Join的时候,你一开始生成的那个执行计划很有可能是不对的. 那么动态执行计划就是指它可以 ...

  9. 基于阿里云服务器Linux系统安装配置Redis

    一.Redis简介 Redis是一个key-value存储系统.和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表).set(集合).zset(有 ...

  10. Qt-LCD电子时钟

    先上效果图吧 就是这个样子,简单的时间显示时间. 这里需要注意的是,我们最好建立一个空文件,这里我们需要建立一个集成QLCDNumber的类 具体方法如下图 一下是源代码 digiclock.h #i ...