TCP_NODELAY

默认情况下,发送数据採用Nagle 算法。这样尽管提高了网络吞吐量,可是实时性却减少了,在一些交互性非常强的应用程序来说是不同意的。使用TCP_NODELAY选项能够禁止Nagle 算法。

此时,应用程序向内核递交的每一个数据包都会马上发送出去。须要注意的是,尽管禁止了Nagle 算法,但网络的传输仍然受到TCP确认延迟机制的影响。

TCP_CORK

所谓的CORK就是塞子的意思,形象地理解就是用CORK将连接塞住。使得数据先不发出去,等到拔去塞子后再发出去。设置该选项后,内核会尽力把小数据包拼接成一个大的数据包(一个MTU)再发送出去。当然若一定时间后(一般为200ms,该值尚待确认)。内核仍然没有组合成一个MTU时也必须发送现有的数据(不可能让数据一直等待吧)。

  然而。TCP_CORK的实现可能并不像你想象的那么完美。CORK并不会将连接全然塞住。

内核事实上并不知道应用层究竟什么时候会发送第二批数据用于和第一批数据拼接以达到MTU的大小,因此内核会给出一个时间限制。在该时间内没有拼接成一个大包(努力接近MTU)的话。内核就会无条件发送。

也就是说若应用层程序发送小包数据的间隔不够短时。TCP_CORK就没有一点作用,反而失去了数据的实时性(每一个小包数据都会延时一定时间再发送)。

Nagle算法

TCP/IP协议中,不管发送多少数据。总是要在数据前面加上协议头。同一时候,对方接收到数据。也须要发送ACK表示确认。

为了尽可能的利用网络带宽。TCP总是希望尽可能的发送足够大的数据。(一个连接会设置MSS參数。因此,TCP/IP希望每次都可以以MSS尺寸的数据块来发送数据)。Nagle算法就是为了尽可能发送大块数据,避免网络中充斥着很多小数据块。

  Nagle算法的基本定义是随意时刻,最多仅仅能有一个未被确认的小段

所谓“小段”。指的是小于MSS尺寸的数据块,所谓“未被确认”。是指一个数据块发送出去后,没有收到对方发送的ACK确认该数据已收到。

  Nagle算法的规则(可參考tcp_output.c文件中tcp_nagle_check函数凝视):

(1)假设包长度达到MSS,则同意发送。
(2)假设该包括有FIN。则同意发送;
(3)设置了TCP_NODELAY选项,则同意发送。
(4)未设置TCP_CORK选项时。若全部发出去的小数据包(包长度小于MSS)均被确认。则同意发送。
(5)上述条件都未满足,但发生了超时(一般为200ms),则马上发送。


  Nagle算法仅仅同意一个未被ACK的包存在于网络,它并无论包的大小。因此它其实就是一个扩展的停-等协议,仅仅只是它是基于包停-等的,而不是基于字节停-等的。Nagle算法全然由TCP协议的ACK机制决定。这会带来一些问题。比方假设对端ACK回复非常快的话。Nagle其实不会拼接太多的数据包。尽管避免了网络拥塞。网络整体的利用率依旧非常低。

Nagle算法是silly window syndrome(SWS)预防算法的一个半集。SWS算法预防发送少量的数据,Nagle算法是其在发送方的实现。而接收方要做的是不要通告缓冲空间的非常小增长,不通知小窗体。除非缓冲区空间有显著的增长。这里显著的增长定义为全然大小的段(MSS)或增长到大于最大窗体的一半。

  注意:BSD的实现是同意在空暇链接上发送大的写操作剩下的最后的小段,也就是说,当超过1个MSS数据发送时。内核先依次发送完n个MSS的数据包,然后再发送尾部的小数据包。其间不再延时等待。(如果网络不堵塞且接收窗体足够大)
举个样例。比方之前的blog中的实验。一開始client端调用socket的write操作将一个int型数据(称为A块)写入到网络中。因为此时连接是空暇的(也就是说还没有未被确认的小段)。因此这个int型数据会被立即发送到server端,接着,client端又调用write操作写入‘\r\n’(简称B块),这个时候,A块的ACK没有返回,所以能够觉得已经存在了一个未被确认的小段。所以B块没有立即被发送。一直等待A块的ACK收到(大概40ms之后),B块才被发送。

整个过程如图所看到的:

这里还隐藏了一个问题,就是A块数据的ACK为什么40ms之后才收到?这是由于TCP/IP中不唯独nagle算法,另一个TCP确认延迟机制 。当Server端收到数据之后,它并不会立即向client端发送ACK。而是会将ACK的发送延迟一段时间(如果为t),它希望在t时间内server端会向client端发送应答数据,这样ACK就行和应答数据一起发送,就像是应答数据捎带着ACK过去。在我之前的时间中。t大概就是40ms。

这就解释了为什么'\r\n'(B块)总是在A块之后40ms才发出。

  当然,TCP确认延迟40ms并非一直不变的,TCP连接的延迟确认时间一般初始化为最小值40ms,随后依据连接的重传超时时间(RTO)、上次收到数据包与本次接收数据包的时间间隔等參数进行不断调整。

另外能够通过设置TCP_QUICKACK选项来取消确认延迟。

CORK算法

Nagle算法和CORK算法非常类似。可是它们的着眼点不一样,Nagle算法主要避免网络由于太多的小包(协议头的比例非常之大)而拥塞。而CORK算法则是为了提高网络的利用率,使得整体上协议头占用的比例尽可能的小。如此看来这二者在避免发送小包上是一致的,在用户控制的层面上。Nagle算法全然不受用户socket的控制,你仅仅能简单的设置TCP_NODELAY而禁用它,CORK算法相同也是通过设置或者清除TCP_CORK使能或者禁用之。然而Nagle算法关心的是网络拥塞问题,仅仅要全部的ACK回来则发包,而CORK算法却能够关心内容。在前后数据包发送间隔非常短的前提下(非常重要,否则内核会帮你将分散的包发出),即使你是分散发送多个小数据包,你也能够通过使能CORK算法将这些内容拼接在一个包内,假设此时用Nagle算法的话,则可能做不到这一点。

在JAVA编程中,能够通过Socket中的

setTcpNoDelay

public void setTcpNoDelay(boolean on)
throws SocketException
启用/禁用 TCP_NODELAY(启用/禁用 Nagle 算法)。

參数:
on - 为 true 表示启用 TCP_NODELAY;为 false 表示禁用。
抛出:
SocketException - 假设底层协议出现错误,比如 TCP 错误。

从下面版本号開始:
JDK1.1
另请參见:
getTcpNoDelay()

来设置是否启用tcp_nodelay,提高网络吞吐量的同一时候必定减少了网络的实时性。

TCP_NODELAY和TCP_CORK nagle算法和cork算法的更多相关文章

  1. 最小生成树---Prim算法和Kruskal算法

    Prim算法 1.概览 普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树.意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点(英语:Vertex (gra ...

  2. mahout中kmeans算法和Canopy算法实现原理

    本文讲一下mahout中kmeans算法和Canopy算法实现原理. 一. Kmeans是一个很经典的聚类算法,我想大家都非常熟悉.虽然算法较为简单,在实际应用中却可以有不错的效果:其算法原理也决定了 ...

  3. 使用Apriori算法和FP-growth算法进行关联分析

    系列文章:<机器学习实战>学习笔记 最近看了<机器学习实战>中的第11章(使用Apriori算法进行关联分析)和第12章(使用FP-growth算法来高效发现频繁项集).正如章 ...

  4. 转载:最小生成树-Prim算法和Kruskal算法

    本文摘自:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/30/2615542.html 最小生成树-Prim算法和Kruskal算法 Prim算 ...

  5. 0-1背包的动态规划算法,部分背包的贪心算法和DP算法------算法导论

    一.问题描述 0-1背包问题,部分背包问题.分别实现0-1背包的DP算法,部分背包的贪心算法和DP算法. 二.算法原理 (1)0-1背包的DP算法 0-1背包问题:有n件物品和一个容量为W的背包.第i ...

  6. 用Spark学习FP Tree算法和PrefixSpan算法

    在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的角度介绍如何使用这两个算法.由于scikit-l ...

  7. 字符串查找算法总结(暴力匹配、KMP 算法、Boyer-Moore 算法和 Sunday 算法)

    字符串匹配是字符串的一种基本操作:给定一个长度为 M 的文本和一个长度为 N 的模式串,在文本中找到一个和该模式相符的子字符串,并返回该字字符串在文本中的位置. KMP 算法,全称是 Knuth-Mo ...

  8. 最小生成树之Prim算法和Kruskal算法

    最小生成树算法 一个连通图可能有多棵生成树,而最小生成树是一副连通加权无向图中一颗权值最小的生成树,它可以根据Prim算法和Kruskal算法得出,这两个算法分别从点和边的角度来解决. Prim算法 ...

  9. java实现最小生成树的prim算法和kruskal算法

    在边赋权图中,权值总和最小的生成树称为最小生成树.构造最小生成树有两种算法,分别是prim算法和kruskal算法.在边赋权图中,如下图所示: 在上述赋权图中,可以看到图的顶点编号和顶点之间邻接边的权 ...

随机推荐

  1. node.js入门之二

    NPM 1.NPM是随同NodeJS一起安装的包管理工具,能解决NodeJS代码部署上的很多问题,常见的使用场景有以下几种: 允许用户从NPM服务器下载别人编写的第三方包到本地使用. 允许用户从NPM ...

  2. 经典算法mark

    在平时找工作的时候,或多或少会遇到一些算法问题,很多都是比较经典或者网上已经流传很久的.只是我们没有接触过,所以不知道怎么解决. 在这儿,我自己总结一些我遇到的一些经典算法,给自己增加一点记忆,也给需 ...

  3. vb 案例学习

    ' ================================================================================================== ...

  4. 新建 vue项目时报错,无法成功搭建项目

    之前电脑已经安装 Node环境和 vue-cli脚手架,但是过段时间没有使用,然后现在用 vue-cli 搭建项目的时候,启动服务器的时候报错,无法启动成功,摸索半天,发现是因为 Node和vue-c ...

  5. Servlet相关的几种中文乱码问题

    Servlet相关的几种中文乱码问题浏览器调用jsp,html等页面中文显示乱码使得文件本身以utf-8字符集编辑保存 让浏览器浏览器以utf-8字符集解析 在浏览器中右键选择编码格式为utf-8: ...

  6. D1. Toy Train (Simplified)

    D1. Toy Train (Simplified) time limit per test 2 seconds memory limit per test 256 megabytes input s ...

  7. C#导出word [无规则表结构+模板遇到的坑]

    1)当然可以考虑使用aspose.word.使用书签替换的方案替换模板中对应的书签值. 2)但是我使用了Interop.Word,下面记录使用类及要注意的地方 3)使用类 Report.cs 来自于网 ...

  8. mysql主从同步,主库宕机解决方案

    链接:https://blog.csdn.net/zfl589778/article/details/51441719

  9. tcpdump用于抓取tcp数据包

    一.简单使用:-c监听次数.-v打印详情.host后接监听地址 1.1.监听 tcpdump -c -v host www.baidu.com 1.2.访问被监听的网址: 1.3.查看监听的数据:

  10. Unity Water Shader

    上图是一个物体浸入水中的效果 原理 我们使用相机渲染的整个场景的深度图减去需要忽略的模型的深度,这里忽略的是图中蓝色部分,就保留了其他的深度值. 用到Main Camera渲染的深度贴图: sampl ...