重传队列实际上就是发送队列(sk->sk_write_queue),保存着发送且未确认的数据段。

当有新的数据段被确认时,需要把这些段从重传队列中删除,同时更新一些变量,包括

packets_out、sacked_out、lost_out、retrans_out等。

对于非重复的ACK,会进行RTT采样,用于更新srtt和rto等时延信息。

本文主要内容:tcp_clean_rtx_queue()的实现。

内核版本:3.2.12

Author:zhangskd @ csdn

函数实现

Q:什么是重传队列?

A:重传队列实际上就是发送队列(sk->sk_write_queue),保存着发送且未确认的数据段。

The retransmit queue is implemented using a linked list to hold all the packets currently in

flight to the receiver.

Q:tcp_clean_rtx_queue()是干什么的?

A:tcp_clean_rtx_queue() is called to remove and free the acknowledged packets from the

retransmit queue, and packets_out is decremented by the number of freed packets.

/* Remove acknowledged frames from the retransmission queue.
* If our packet is before the ack sequence we can discard it as it's confirmed to
* have arrived at the other end.
*/ static int tcp_clean_rtx_queue(struct sock *sk, int prior_fackets, u32 prior_snd_una)
{
struct tcp_sock *tp = tcp_sk(sk);
const struct inet_connection_sock *icsk = inet_csk(sk);
struct sk_buff *skb;
u32 now = tcp_time_stamp; /* 当前时间,用于计算RTT */
int fully_acked = 1; /* 表示数据段是否完全被确认 */
int flag = 0;
u32 pkts_acked = 0;
u32 reord = tp->packets_out;
u32 prior_sacked = tp->sacked_out;
s32 seq_rtt = -1;
s32 ca_seq_rtt = -1;
ktime_t last_ackt = net_invalid_timestamp(); /* 把last_ackt置为0*/ /* 遍历发送队列sk_write_queue
* 注意:遍历到snd_una即停止,也就是说如果snd_una没更新,那么这个循环马上就退出!
*/
while ((skb = tcp_write_queue_head(sk)) && skb != tcp_send_head(sk)) {
struct tcp_skb_cb *scb = TCP_SKB_CB(skb);
u32 acked_pcount;
u32 sacked = scb->sacked; /* 记分板scoreboard */ /* Determine how many packets and what bytes were acked, tso and else.
* tp->snd_una已经是更新过的了,所以从发送队列头到snd_una就是此ACK确认的数据量。
*/
if (after(scb->end_seq, tp->snd_una)) {
/* 如果没有使用TSO,或seq >= snd_una,那么就退出遍历*/
if (tcp_skb_pcount(skb) == 1 || ! after(tp->snd_una, scb->seq))
break; /* 如果只确认了TSO段中的一部分,则截掉确认的部分,并统计确认了多少段*/
acked_pcount = tcp_tso_acked(sk, skb); if (! acked_pcount) /* 处理出错 */
break; fully_acked = 0; /* 表示没有确认完TSO段*/
} else {
acked_pcount = tcp_skb_pcount(skb); /* 统计确认段的个数*/
} /* 如果此段被重传过*/
if (sacked & TCPCB_RETRANS) { if (sacked & TCPCB_SACKED_RETRANS) /* 之前重传了还没有恢复*/
tp->retrans_out -= acked_pcount; /* 更新网络中重传且未确认段的数量*/ flag |= FLAG_RETRANS_DATA_ACKED;
ca_seq_rtt = -1;
seq_rtt = -1; if ((flag & FLAG_DATA_ACKED) || (acked_pcount > 1))
flag |= FLAG_NONHEAD_RETRANS_ACKED; } else { /* 如果此段没有被重传过*/
ca_seq_rtt = now - scb->when; /* 通过此ACK计算skb的RTT采样值*/
last_ackt = skb->tstamp; /* 获取此skb的发送时间,可以精确到纳秒!*/
if (seq_rtt < 0) {
seq_rtt = ca_seq_rtt;
} /* 如果SACK块中有空洞,那么保存其中序号最小号的 */
if (! (sacked & TCPCB_SACKED_ACKED))
reord = min(pkts_acked, reord);
} /* 如果skb之前是带有SACK标志 */
if (sacked & TCPCB_SACKED_ACKED)
tp->sacked_out -= acked_pcount; /* 更新sacked_out */ /* 如果skb之前是带有LOST标志 */
if (sacked & TCPCB_LOST)
tp->lost_out -= acked_pcount; /* 更新lost_out */ tp->packets_out -= acked_pcount; /* 更新packets_out */
pkts_acked += acked_pcount; /* 累加此ACK确认的数据量*/ /* Initial outgoing SYN's get put onto the write_queue just like anything else
* we transmit. It is not true data, and if we misinform our callers that this ACK
* acks real data, we will erroneously exit connection startup slow start one packet
* too quickly. This is severely frowned upon behavior.
*/
if (! (scb->flags & TCPHDR_SYN)) {
flag |= FLAG_DATA_ACKED; /* 确认了新的数据 */ } else {
flag |= FLAG_SYN_ACKED; /* 确认了SYN段 */
tp->retrans_stamp = 0; /* Clear the stamp of the first SYN */
} if (! fully_acked) /* 如果TSO段没被完全确认,则到此为止*/
break; tcp_unlink_write_queue(skb, sk); /* 从发送队列上移除skb */
sk_wmem_free_skb(sk, skb); /* 删除skb的内存对象*/
tp->scoreboard_skb_hint = NULL;
if (skb == tp->retransmit_skb_hint)
tp->retransmit_skb_hint = NULL;
if (skb == tp->lost_skb_hint)
tp->lost_skb_hint = NULL;
} /* 退出循环了这里*/ if (likely(between(tp->snd_up, prior_snd_una, tp->snd_una)))
tp->snd_up = tp->snd_una; /* 更新Urgent pointer */ if (skb && (TCP_SKB_CB(skb)->sacked & TCPCB_SACKED_ACKED))
flag |= FLAG_SACK_RENEGING; /* 虚假的SACK */ /* 如果此ACK确认了新数据,使snd_una前进了*/
if (flag & FLAG_ACKED) {
const struct tcp_congestion_ops *ca_ops = inet_csk(sk)->icsk_ca_ops; /* 如果路径MTU的探测段被确认了*/
if (unlikely(icsk->icsk_mtup.probe_size &&
! after(tp->mtu_probe.probe_seq_end, tp->snd_una))) {
tcp_mtup_probe_success(sk);
} /* 更新srtt、RTO等RTT相关变量*/
tcp_ack_update_rtt(sk, flag, seq_rtt);
tcp_rearm_rto(sk); /* 重置超时重传定时器*/ if (tcp_is_reno(tp)) {
/* Reno模拟SACK处理,更新tp->sacked_out。
* 如果检测到乱序,更新tp->reordering。
*/
tcp_remove_reno_sacks(sk, pkts_acked); } else {
int delta;
/* Non-retransmitted hole got filled? That's reordering。
* 如果之前没有SACK,prior_fackets为0,不会更新。
*/
if (reord < prior_fackets)
tcp_update_reordering(sk, tp->fackets_out - reord, 0); /* 更新乱序队列大小*/ delta = tcp_is_fack(tp) ? pkts_acked : prior_sacked - tp->sacked_out;
tp->lost_cnt_hint = -= min(tp->lost_cnt_hint, delta);
} tp->fackets_out -= min(pkts_acked, tp->fackets_out); /* 更新fackets_out */ /* 如果定义了pkts_acked()钩子*/
if (ca_ops->pkts_acked) {
s32 rtt_us = -1;
/* Is the ACK triggering packet unambiguous?,确认了非重传的数据段 */
if (! (flag & FLAG_RETRANS_DATA_ACKED)) {
/* High resolution needed and available?
* 高精确度的RTT测量,可以精确到微秒!
*/
if (ca_ops->flags & TCP_CONG_RTT_STAMP &&
! ktime_equal(last_ackt, net_invalid_timestamp()))
rtt_us = ktime_us_delta(ktime_get_real(), last_ackt); else if (ca_seq_rtt >=0) /* 普通测量,精确到毫秒,再转为微秒*/
rtt_us = jiffies_to_usecs(ca_seq_rtt);
} ca_ops->pkts_acked(sk, pkts_acked, rtt_us); /* 我们可以自定义的 */
}
} #if FASTRETRANS_DEBUG > 0
WARN_ON((int) tp->sacked_out < 0);
WARN_ON((int) tp->lost_out < 0);
WARN_ON((int) tp->retrans_out < 0); if (! tp->packets_out && tcp_is_sack(tp)) {
icsk = inet_csk(sk);
if (tp->lost_out) {
printk(KERN_DEBUG "Leak l=%u %d\n", tp->lost_out, icsk->icsk_ca_state);
tp->lost_out = 0;
} if (tp->sacked_out) {
printk(KERN_DEBUG "Leak s=%u %d\n", tp->sacked_out, icsk->icsk_ca_state);
tp->sacked_out = 0;
} if (tp->retrans_out) {
printk(KERN_DEBUG "Leak r=%u %d\n", tp->retrans_out, icsk->icsk_ca_state);
tp->retrans_out = 0;
}
} #endif
return flag;
}

ktime_t

/*
* ktime_t
* On 64-bit CPUs a single 64-bit variable is used to store the hrtimes internal
* representation of time values in scalar nanoseconds. The design plays out
* best on 64-bit CPUs, where most conversions are NOPs and most arithmetic
* ktime_t operations are plain arithmetic operations.
*
* On 32-bit CPUs an optimized representation of the timespec structure is used to
* avoid expensive conversions from and to timespecs. The endian-aware order of
* the tv struct members is chosen to allow mathematical operations on the tv64
* member of the union too, which for certain operations produces better code.
*
* For architectures with efficient support for 64/32-bit conversions the plain scalar
* nanosecond based representation can be selected by the config switch
* CONFIG_KTIME_SCALAR.
*/ union ktime {
s64 tv64; #if BITS_PER_LONG != 64 && !defined(CONFIG_KTIME_SCALAR)
struct {
#ifdef __BIG_ENDIAN
s32 sec, nsec;
#else
s32 nsec, sec;
#endif
} tv;
#endif
}; typedef union ktime ktime_t; /* 返回值为0的ktime_t*/
static inline ktime_t net_invalid_timestamp(void)
{
return ktime_set(0, 0);
}

TSO

当TSO段不是整个被确认,而是被确认一部分时,那么就分割TSO段,返回确认的段数。

/* If we get here, the whole TSO packet has not been acked. */
static u32 tcp_tso_acked(struct sock *sk, struct sk_buff *skb)
{
struct tcp_sock *tp = tcp_sk(sk);
u32 packets_acked; BUG_ON(! after(TCP_SKB_CB(skb)->end_seq, tp->snd_una)); packets_acked = tcp_skb_pcount(skb); /* tso段总共包括多少个段*/ if (tcp_trim_head(sk, skb, tp->snd_una - TCP_SKB_CB(skb)->seq))
return 0; packets_acked -= tcp_skb_pcount(skb); /* 减去未确认的段*/ if (packets_acked) {
BUG_ON(tcp_skb_pcount(skb) == 0);
BUG_ON(! before(TCP_SKB_CB(skb)->seq, TCP_SKB_CB(skb)->end_seq));
} return packets_acked; /* 返回确认的段数 */
}

TCP的核心系列 — 重传队列的更新和时延的采样(一)的更多相关文章

  1. TCP的核心系列 — 重传队列的更新和时延的采样(二)

    在tcp_clean_rtx_queue()中,并非对每个ACK都进行时延采样.是否进行时延采样,跟这个ACK是否为 重复的ACK.这个ACK是否确认了重传包,以及是否使用时间戳选项都有关系. 本文主 ...

  2. TCP的核心系列 — ACK的处理(一)

    TCP发送数据包后,会收到对端的ACK.通过处理ACK,TCP可以进行拥塞控制和流控制,所以 ACK的处理是TCP的一个重要内容.tcp_ack()用于处理接收到的ACK. 本文主要内容:TCP接收A ...

  3. TCP的核心系列 — SACK和DSACK的实现(五)

    18版本对于每个SACK块,都是从重传队列头开始遍历.37版本则可以选择性的遍历重传队列的某一部分,忽略 SACK块间的间隙.或者已经cache过的部分.这主要是通过tcp_sacktag_skip( ...

  4. TCP的核心系列 — SACK和DSACK的实现(一)

    TCP的实现中,SACK和DSACK是比较重要的一部分. SACK和DSACK的处理部分由Ilpo Järvinen (ilpo.jarvinen@helsinki.fi) 维护. tcp_ack() ...

  5. TCP的核心系列 — SACK和DSACK的实现(二)

    和18版本相比,37版本的SACK和DSACK的实现做了很多改进,最明显的就是需要遍历的次数少了, 减少了CPU的消耗.37版的性能提升了,代码有大幅度的改动,逻辑也更加复杂了. 本文主要内容:37版 ...

  6. TCP的核心系列 — SACK和DSACK的实现(七)

    我们发送重传包时,重传包也可能丢失,如果没有检查重传包是否丢失的机制,那么只能依靠超时来恢复了. 37版本把检查重传包是否丢失的部分独立出来,这就是tcp_mark_lost_retrans(). 在 ...

  7. TCP的核心系列 — SACK和DSACK的实现(六)

    上篇文章中我们主要说明如何skip到一个SACK块对应的开始段,如何walk这个SACK块包含的段,而没有涉及到 如何标志一个段的记分牌.37版本把给一个段打标志的内容独立出来,这就是tcp_sack ...

  8. TCP的核心系列 — SACK和DSACK的实现(四)

    和18版本不同,37版本把DSACK的检测部分独立出来,可读性更好. 37版本在DSACK的处理中也做了一些优化,对DSACK的两种情况分别进行处理. 本文主要内容:DSACK的检测.DSACK的处理 ...

  9. TCP的核心系列 — ACK的处理(二)

    本文主要内容:tcp_ack()中的一些细节,如发送窗口的更新.持续定时器等. 内核版本:3.2.12 Author:zhangskd @ csdn 发送窗口的更新 什么时候需要更新发送窗口呢? (1 ...

随机推荐

  1. 改进版getpass库

    编程伊始 正式实施 改进版 源码 以数字显示 以自定义分隔符delimiter显示 如何使用 下载及安装 在您的代码中使用 源码下载 总结 用过Linux的都知道,尤其是进行使用包管理软件类似于apt ...

  2. 27 自定义View 和案例

    有时安卓提供的View不满足我们的需求时可以创建一个类继承View或其子类重写方法 如 package com.qf.sxy.day28_customview.view; import android ...

  3. BASH如何获得某个目录下的某类文件的文件名

    假设某个目录下有一堆以jpeg为后缀的文件名,我们需要在另一个目录中获得他们的文件名,并输出. 可以联合使用ls,awk,sed等命令来完成. 方法一: 使用ls列出目录下以.jpeg为结尾的文件,然 ...

  4. java虚拟机 jvm 栈数据区

    java栈帧还是需要一些数据支持常量池的解析.正常方法的返回和异常的处理.大部分的java字节码指令需要进行常量池的访问,在栈帧数据区中保存着访问常量池的指针,方便程序访问java常量池.如下图所示: ...

  5. iOS9中关于地址簿ABAddressBookXXX之类方法被废弃的解决

    大熊猫猪·侯佩原创或翻译作品.欢迎转载,转载请注明出处. 如果觉得写的不好请多提意见,如果觉得不错请多多支持点赞.谢谢! hopy ;) 在iOS9的SDK中我们会发现原来地址簿权限查询,获取以及创建 ...

  6. 深入理解CoordinatorLayout.Behavior

    要研究的几个问题 一.Behavior是什么?为什么要用Behavior? 二.怎么使用Behavior? 三.从源码角度看为什么要这么使用Behavior? 一.Behavior是什么?为什么要用B ...

  7. 福利:工作经常用到的Mac软件整理(全)

    每日更新关注:http://weibo.com/hanjunqiang  新浪微博!iOS开发者交流QQ群: 446310206 前言 这是我个人在工作中会用到的Mac软件,其中包括办公.开发.视频等 ...

  8. Android简易实战教程--第十三话《短信备份和还原~三》

    之前写过短信备份的小案例,哪里仅仅是虚拟了几条短信信息.本篇封装一个业务类,且直接通过内容提供者,访问本系统的短信信息,再提供对外接口.如果想要短信备份和短信还原,直接复制这段代码即可.对于您调用这个 ...

  9. (NO.00004)iOS实现打砖块游戏(十一):"一闪一闪亮晶晶,我们都是小星星"

    大熊猫猪·侯佩原创或翻译作品.欢迎转载,转载请注明出处. 如果觉得写的不好请告诉我,如果觉得不错请多多支持点赞.谢谢! hopy ;) 现在一个基本的游戏逻辑已经搭建好了,但是感觉还是缺点什么呢? 蠢 ...

  10. (NO.00004)iOS实现打砖块游戏(三):游戏主场景和砖块

    大熊猫猪·侯佩原创或翻译作品.欢迎转载,转载请注明出处. 如果觉得写的不好请告诉我,如果觉得不错请多多支持点赞.谢谢! hopy ;) 制作墙体 首先在SpriteBuilder中新建Wall.ccb ...