在tcp_clean_rtx_queue()中,并非对每个ACK都进行时延采样。是否进行时延采样,跟这个ACK是否为

重复的ACK、这个ACK是否确认了重传包,以及是否使用时间戳选项都有关系。

本文主要内容:tcp_clean_rtx_queue()的一些细节,时延采样的条件。

内核版本:3.2.12

Author:zhangskd @ csdn

记分牌

TCP_SKB_CB(skb)->sacked称为skb的记分牌,用于跟踪skb的状态。

以下是skb记分牌可能的取值:

#define TCPCB_SACKED_ACKED 0x01 /* skb被SACKed */
#define TCPCB_SACKED_RETRANS 0x02 /* skb retransmitted */
#define TCPCB_LOST 0x04 /* skb判断为LOST */
#define TCPCB_TAGBITS 0x07 /* All tag bits */
#define TCPCB_EVER_RETRANS 0x80 /* Ever retransmitted frame */
#define TCPCB_RETRANS (TCPCB_SACKED_RETRANS | TCPCB_EVER_RETRANS)

TCPCB_SACKED_RETRANS和TCPCB_EVER_RETRANS有什么区别呢?

当一个skb被重传了,它的记分牌就会添加TCPCB_RETRANS标志。

当重传的skb被sack确认或者ack累积确认时,就会清除TCPCB_SACKED_RETRANS标志,

但是这个时候TCPCB_EVER_RETRANS还保留,表示这个skb曾经被重传过。

TCPCB_EVER_RETRANS在更新RTT中发挥作用,如果skb曾经重传过,那么就不根据它来计算RTT

采样值,更新srtt和rto等。

释放段

从发送队列sk->sk_write_queue上移除skb,并非从物理内存中释放skb。

static inline void tcp_unlink_write_queue(struct sk_buff *skb, struct sock *sk)
{
__skb_unlink(skb, &sk->sk_write_queue);
} static inline void __skb_unlink(struct sk_buff *skb, struct sk_buff_head *list)
{
struct sk_buff *next, *prev;
list->qlen--; /* 发送队列长度减1 */
next = skb->next;
prev = skb->prev;
skb->next = skb->prev = NULL;
next->prev = prev;
prev->next = next;
} static inline void sk_wmem_free_skb(struct sock *sk, struct sk_buff *skb)
{
sock_set_flag(sk, SOCK_QUEUE_SHRUNK); /* 设置标志,表示有skb释放了*/
sk->sk_wmem_queue -= skb->truesize; /* 更新发送队列所占内存*/
sk_mem_uncharge(sk, skb->truesize);
__kfree_skb(skb); /* 释放skb占用的内存*/
}

Reno ACK处理

场景:Reno中收到ACK的时候。

这时候会模拟SACK,更新tp->sacked_out和tp->reordering。

/* Account for ACK, ACKing some data in Reno Recovery phase. */
static void tcp_remove_reno_sacks(struct sock *sk, int acked)
{
struct tcp_sock *tp = tcp_sk(sk); if (acked > 0) {
/* One ACK acked hole. The rest eat duplicate ACKs.
* 收到正常ACK,不在Recovery状态。
* 收到Cummulative ACK,确认完所有的sacked包。
*/
if (acked - 1 >= tp->sacked_out)
tp->sacked_out = 0;
else /* 收到Partial ACK,确认了部分sack包*/
tp->sacked_out -= acked - 1;
} /* 检查是否有乱序,有的话更新tp->reordering */
tcp_check_reno_reordering(sk, acked);
tcp_verify_left_out(tp);
}

时延采样

(1)什么情况下进行RTT采样?

首先,如果是重复的ACK,即没有使snd_una前进的ACK,那么是不会进入RTT更新路径的:

if (flag & FLAG_ACKED)

{

...

tcp_ack_update_rtt(sk, flag, seq_rtt);

tcp_rearm_rto(sk);

...

}

其次,有确认新数据的情况下:

1. 没有使用时间戳选项(tcp_ack_no_tstamp)

确认的数据段中不能包含重传过的段(FLAG_RETRANS_DATA_ACKED)。

因为我们无法知道是哪个包,原始包还是重传包触发了这个ACK,因此无法确定触发包的

发送时间。

如果此ACK确认了多个段,则使用第一个被确认段的发送时间来计算seq_rtt。

2. 使用时间戳选项(tcp_ack_saw_tstamp)

RTTM rule:A TSecr value received in a segment is used to update the averaged

RTT measurement only if the segment acknowledges some new data, i.e, only if

it advances the left edge of the send window.

此时我们知道这个ACK的触发段的确切发送时间为:tp->rx_opt.rcv_tsecr,所以我们计算得到

的RTT总是正确的,而不用去考虑触发这个ACK的是原始包还是重传包。

(2)icsk_ca_ops->pkts_acked()的调用

如果被此ACK确认的数据段中,含有重传过的数据段,那么就设置FLAG_RETRANS_DATA_ACKED,

ca_ops->pkts_acked(sk, pkts_acked, rtt_us)中的rtt_us = -1。

当有FLAG_ACKED标志(FLAG_DATA_ACKED | FLAG_SYN_ACKED)时调用。

有FLAG_RETRANS_DATA_ACKED设置,表示此ACK确认的是重传的数据包,这个时候rtt_us为-1。

#define FLAG_NOT_DUP (FLAG_DATA | FLAG_WIN_UPDATE | FLAG_ACKED)

Q: 那么,在什么情况下无法观测到正常的RTT呢?

A: 重传数据包的ACK、Dup ACK、Partical ACK、Cumulative ACK。

(3)各个状态下的时延采样

1. Open、CWR

对每个ACK都进行RTT采样。

2. Disorder

dup ACK,不进行RTT采样。

cumulative ACK,进行RTT采样。

3. Recovery

dup ACK,不进行RTT采样。

partical ACK

不启用Timstamp,不进行RTT采样。

启用Timestamp,进行RTT采样。

cumulative ACK

不启用Timstamp,不进行RTT采样。

启用Timestamp,进行RTT采样。

4. Loss

partical ACK

不启用Timstamp,不进行RTT采样。

启用Timestamp,进行RTT采样。

cumulative ACK

不启用Timstamp,不进行RTT采样。

启用Timestamp,进行RTT采样。

(4)重置超时重传定时器

每次更新SRTT和RTO后,都重置超时重传定时器。

/* Restart timer after forward progress on connection.
* RFC2988 recommends to restart timer to now + rto.
*/
static void tcp_rearm_rto(struct sock *sk)
{
const struct tcp_sock *tp = tcp_sk(sk); if (! tp->packets_out) { /* 如果网络上没有数据,删除超时重传定时器*/
inet_csk_clear_xmit_timer(sk, ICSK_TIME_RETRANS); } else { /* 重置超时重传定时器*/
inet_csk_reset_ximit_timer(sk, ICSK_TIME_RETRANS, inet_csk(sk)->icsk_rto, TCP_RTO_MAX);
}
}

TCP的核心系列 — 重传队列的更新和时延的采样(二)的更多相关文章

  1. TCP的核心系列 — 重传队列的更新和时延的采样(一)

    重传队列实际上就是发送队列(sk->sk_write_queue),保存着发送且未确认的数据段. 当有新的数据段被确认时,需要把这些段从重传队列中删除,同时更新一些变量,包括 packets_o ...

  2. TCP的核心系列 — ACK的处理(一)

    TCP发送数据包后,会收到对端的ACK.通过处理ACK,TCP可以进行拥塞控制和流控制,所以 ACK的处理是TCP的一个重要内容.tcp_ack()用于处理接收到的ACK. 本文主要内容:TCP接收A ...

  3. TCP的核心系列 — SACK和DSACK的实现(五)

    18版本对于每个SACK块,都是从重传队列头开始遍历.37版本则可以选择性的遍历重传队列的某一部分,忽略 SACK块间的间隙.或者已经cache过的部分.这主要是通过tcp_sacktag_skip( ...

  4. TCP的核心系列 — SACK和DSACK的实现(一)

    TCP的实现中,SACK和DSACK是比较重要的一部分. SACK和DSACK的处理部分由Ilpo Järvinen (ilpo.jarvinen@helsinki.fi) 维护. tcp_ack() ...

  5. TCP的核心系列 — SACK和DSACK的实现(二)

    和18版本相比,37版本的SACK和DSACK的实现做了很多改进,最明显的就是需要遍历的次数少了, 减少了CPU的消耗.37版的性能提升了,代码有大幅度的改动,逻辑也更加复杂了. 本文主要内容:37版 ...

  6. TCP的核心系列 — SACK和DSACK的实现(七)

    我们发送重传包时,重传包也可能丢失,如果没有检查重传包是否丢失的机制,那么只能依靠超时来恢复了. 37版本把检查重传包是否丢失的部分独立出来,这就是tcp_mark_lost_retrans(). 在 ...

  7. TCP的核心系列 — SACK和DSACK的实现(六)

    上篇文章中我们主要说明如何skip到一个SACK块对应的开始段,如何walk这个SACK块包含的段,而没有涉及到 如何标志一个段的记分牌.37版本把给一个段打标志的内容独立出来,这就是tcp_sack ...

  8. TCP的核心系列 — SACK和DSACK的实现(四)

    和18版本不同,37版本把DSACK的检测部分独立出来,可读性更好. 37版本在DSACK的处理中也做了一些优化,对DSACK的两种情况分别进行处理. 本文主要内容:DSACK的检测.DSACK的处理 ...

  9. TCP的核心系列 — ACK的处理(二)

    本文主要内容:tcp_ack()中的一些细节,如发送窗口的更新.持续定时器等. 内核版本:3.2.12 Author:zhangskd @ csdn 发送窗口的更新 什么时候需要更新发送窗口呢? (1 ...

随机推荐

  1. 如果用一个循环数组q[0..m-1]表示队列时,该队列只有一个队列头指针front,不设队列尾指针rear,求这个队列中从队列投到队列尾的元素个数(包含队列头、队列尾)。

    #include <iostream> using namespace std; //循环队列(少用一个空间)长度 #define M (8+1) typedef struct node ...

  2. LibVLC自定义插件目录,获取FPS方法

    一.自定义插件目录 在Windows平台,使用LibVLC,只需要在VLC官网的nightly builds下载最新的win32 debug或win64 debug包, 解压缩之后,会有libvlc. ...

  3. Java使用agent实现main方法之前

    创建Agent项目 PreMainExecutor 类,在main方法之前执行此方法 public class PreMainExecutor { public static void premain ...

  4. JAVA进阶之旅(一)——增强for循环,基本数据类型的自动拆箱与装箱,享元设计模式,枚举的概述,枚举的应用,枚举的构造方法,枚举的抽象方法

    JAVA进阶之旅(一)--增强for循环,基本数据类型的自动拆箱与装箱,享元设计模式,枚举的概述,枚举的应用,枚举的构造方法,枚举的抽象方法 学完我们的java之旅,其实收获还是很多的,但是依然还有很 ...

  5. JAVA面向对象-----instanceof 关键字

    instanceof 关键字 1:快速演示instanceof Person p=new Person(); System.out.println( p instanceof Person); 2:i ...

  6. XML之SAX解析模型

    DOM解析会把整个XML文件全部映射成Document里的树形结构,当遇到比较大的文件时,它的内存占用很大,查找很慢 SAX就是针对这种情况出现的解决方案,SAX解析器会从XML文件的起始位置起进行解 ...

  7. Linux jar包 后台运行

    Linux 运行jar包命令如下: 方式一: java -jar shareniu.jar 特点:当前ssh窗口被锁定,可按CTRL + C打断程序运行,或直接关闭窗口,程序退出 那如何让窗口不锁定? ...

  8. Android 字体设置-Typeface讲解

    控件的字体设置的两种方式 常用的字体类型名称还有: Typeface.DEFAULT //常规字体类型 Typeface.DEFAULT_BOLD //黑体字体类型 Typeface.MONOSPAC ...

  9. Android实现分享图片和文字的功能

    为了应用的推广,我们经常看到点击分享按钮会出现,比如微博微信等应用的分享二等列表,这是如何实现的呢?这一篇将要详细的介绍. android的实现分享是通过隐式的启动activity. 分享文本 1.a ...

  10. 1.关于QT中的Graphics绘图,定时器,动画,将窗口中的内容打印到图片上,打印机,打印预览

     1 新建项目 A  修改pro中的内容如下: HEADERS += \ MyWidget.h SOURCES += \ MyWidget.cpp QT += gui widgets prints ...