深入理解TCP/IP传输层
传输层:负责数据能够从发送端传到接收端(只需要关注点对点的传输,中间的传输过程一概不管)
UDP和TCP
UDP(全双工):
1.无连接,2不可靠,3.面向数据报

分别表示UDP源端口号、目的端口号、UDP长度、UDP检验和
端口号在传输层的概念:区分这个数据要交给哪个程序去处理,启动一个服务器,会和一个端口号相绑定,一般HTTP绑定在80端口号,来区分发件人和收件人
UDP的报文长度最多是64k,这是一个比较小的数字,这就限制了应用层协议的数据长度,一旦数据长度超出了UDP的表示范围,就会出现问题
可以在应用层通过代码,将数据拆分成多个数据报,再使用多个UDP数据报来分别发送
代码实现的成本大大提高了
校验和(检验和):比较简短,同时最好能和内容相关联
UDP中使用的是CRC循环冗余校验的方式
uint16_tchecksum1 =0;
for(依次遍历数据包的每个字节){
checksum+=当前字节的值
}
发送者在发送前先计算了一个校验和checksum1
就把数据和checksum1一起发送到对端
接收端也按照相同的规则计算校验和checksum2
对比checksum1和checksum2是否相同
校验和出错就会直接丢弃
UDP的特点:
无连接:知道对端的IP的端口号就可以直接传输,不需要建立连接
不可靠:没有确认机制,没有重传机制,如果因为网络故障该段无法发送到对端,UDP协议也不会给应用层返回任何错误信息
面向数据报:不能灵活的控制读写数据的次数和数量
面向数据报
 应用层交给UDP多长的报文,UDP原样发送,既不会拆分,也不会合并
用UDP传输100个字节的数据:
如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字
节; 而不能循环调用10次recvfrom, 每次接收10个字节
基于UDP的应用层协议 
当然, 也包括你自己写UDP程序时自定义的应用层协议
NFS: 网络文件系统
TFTP: 简单文件传输协议
DHCP: 动态主机配置协议
BOOTP: 启动协议(用于无盘设备启动)
DNS: 域名解析协议
TCP协议

TCP(全双工,是一个比较复杂的协议 )协议特点:
1.有连接:需要用端口号建立连接
2.可靠传输:发送者能感知到是否发送成功
3.面向字节流:字节流读取数据
TCP最核心的机制 :
1.可靠传输
2.尽可能提高传输效率
可靠性传输 发送者能感知到失败(对比打电话和发短信)
面向字节流,文件操作(I/O流)
全双工:既能发送也能接受
UDP虽不可靠,但传输效率比TCP高
TCP通过判断发送的消息是否被回复,来判断是否可靠传输
一、确认应答(可靠性的核心机制)
序号来说,按照每个字节的方式来编号的.
确认序列来说,表示当前序号之前的数据已经正确收到了
接下来对端应该给我发送确认序号开始的数据
二、超时重传(可靠性的核心机制)和确认应答相辅相成
如果对方没有确认应答,此时隔一定的时间之后,就需要重复传输这样的数据,
重传是为了进一步降低丢包的可能性,重传的间隔时间采用的是一种比较悲观的态度,
等待的时间越来越长
如果达到一定次数之后对方还没有响应,就断开和对方的通信连接
如果是应答数据包丢失(ACK),同样会超时重传,此时就导致接收方收到了两份相同的数据,TCP会跟据序号来自动去重
三、连接管理(也是可靠性的一部分)
建立连接的意义:
1.双方先试探下对方是否适合和我通信
2.双方可以协商一些重要数据,序号从几开始
三次握手



三次握手中涉及到的状态变化
1.LISTEN状态(服务器):手机开机,并且信号良好
2.ESTABLISHED状态(客户端/服务器):电话拨通之后对方接听了
第一次握手:建立连接时,客户端发送syn包(syn=1)到服务器,客户端进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)。
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=x+1),同时自己也发送一个SYN包(syn=y),即SYN+ACK包,此时服务器进入SYN_RECV状态;
第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=y+1),此包发送完毕,客户端和服务器进入ESTABLISHED(TCP连接成功)状态,完成三次握手
为什么要三次握手?
三次握手的目的是建立可靠的通信信道,说到通讯,简单来说就是数据的发送与接收,而三次握手最主要的目的就是双方确认自己与对方的发送与接收机能正常
四次挥手的过程:


双各自向对方发送FIN,再各自向对方发送ACK
中间的两次交互可能合并为一个(在特殊情况下仅仅是可能,所以有些情况下是三次挥手)
第一次挥手,client:我说完了
第二次挥手,server:我知道了(但此时server可能还有话要说)
第三次挥手,server:我也说完了
第四次挥手,client:我知道了,(双方挂了电话)
为什么要四次挥手?
答:根本原因是,一方发送FIN只表示自己发完了所有要发的数据,但还允许对方继续把没发完的数据发过来。
举个例子:
A和B打电话,通话即将结束后,A说“我没啥要说的了”,B回答“我知道了”,但是B可能还会有要说的话,A不能要求B跟着自己的节奏结束通话,于是B可能又巴拉巴拉说了一通,最后B说“我说完了”,A回答“知道了”,这样通话才算结束。
双方各自向对方发送FIN,再各自向对方发送ACK
中间的两次交互,可能合并成一个(四次挥手变为三次挥手)
四次挥手的状态转换:
1.CLOSE_WAIT:收到第一个FIN的一方进入CLOSE_WAIT,是为了等待代码中调用 关闭 方法
如果你发现服务器上出现大量的CLOSE_WAIT状态,意味着什么?意味着代码有bug,忘记调用close方法了
2.TIME_WAIT:主动断开链接的一方进入到TIME_WAIT状态,存在的意义是一旦最后一个 ACK 丢包,还有机会进行重传
TIME_WAIT 会存在一定的时间,在超出这个时间之后,TIME_WAIT状态才会真正消失,释放对应的链接
2MSL:
MSL表示互联网上任何两点之间传输数据的最大时间 1min
四、滑动窗口(提高传输效率)
窗口的意义是:不等待ACK的情况下最多发送多少数据
滑动的含义是:每次收到 ACK 数据的同时,就继续往后发下一组数据
如果窗口越大,传输效率越高
窗口也不能无限大,如果窗口太大可能会影响到可靠性
滑动窗口中如果丢包,采用快速重传的方式来进行重传
快速重传:快速重传本质上就是超时重传,只不过重传的时候,没有拖泥带水,只重传了真正丢包的数据
五、流量控制
窗口越大,传输效率越高,但是窗口也不能无限大
如果窗口太大,可能接收端,处理不过来
若果生产速度超过了消费速度,接受缓冲区的内容就会越积越多,达到一定程度,缓冲区满了,此时再传输的数据就会丢包
使用 接受缓冲区空余空间的大小,用这个指标衡量接收端的处理能力
通过这个指标来控制发送端的窗口大小(发送速度)
接收端缓冲区空余空间的大小,作为TCP协议报头中的窗口大小,这个值就是发送端的滑动窗口大小的一个“建议值”
六、拥塞控制

滑动窗口的窗口大小不能无限大,即使接收端处理速度很快,也可能因为网路环境不佳导致数据丢包
最终的 滑动窗口大小是由 流量控制 和 拥塞控制 共同决定的
拥塞窗口:拥塞控制机制所建议的窗口大小,从一个比较小的数字开始,如果网络通畅,放大窗口大小,如果网络丢包,
缩小窗口大小
滑动窗口的最终值就是:流量控制的窗口 和 拥塞窗口 的较小值
慢开始:刚开始传输的时候拥塞窗口设置的小一些
七、延时应答(提高传输效率)
在可靠性的基础上,尽量提高窗口大小
也是和滑动窗口以及流量控制相关
流量控制中需要在ACK中反馈接受缓冲区剩余空间的大小
此时采取的策略是,收到数据不立刻返回ACK,而是等一会,
等的过程中,程序就能多消费一些缓冲区中的数据,从而导致反馈的窗口大小就要更大一些
八、捎带应答(提高传输效率)
建立在延时应答的基础上的
内核反馈ACK的实际和程序反馈响应的时机合二为一,通过同一个数据报同时带上两方面的信息
九、面向字节流
粘包问题
由于面向字节流读取数据方式没有具体的约定,很难从接受缓存区中直接获取到一个完整的应用层数据报
解决粘包问题只能从应用层角度入手,只要在应用层协议设定的时候,明确包的边界就可以了
1、指定分割符
2、指定包的长度
十、异常情况
1.程序异常结束(没啥影响,四次挥手正常完成)
2.系统关机(没啥影响,本质上就是要先强制关闭所有程序)
3.主机掉电(拔网线)
a.掉电的是接收方,发送方会触发超时重传,尝试重新建立链接,彻底释放链接
b.掉电的是发送方,接收方如果一直接收不到数据的话,达到一定的时间,就会给对方
发送一个“心跳包”,如果没有心跳了,就会重新尝试链接,如果链接建立失败了,彻底释放链接
TCP和UDP的对比:
1.如果需要使用可靠传输,优先考虑TCP
2.如果传输的单个数据报比较大,还是考虑TCP
3.如果对可靠性要求没那么高,但是对性能要求很高,优先考虑UDP
4.如果需要实现广播,优先考虑UDP
如何使用UDP来进行可靠传输?
只能在应用层,通过代码来手动实现
深入理解TCP/IP传输层的更多相关文章
- 面试热点|理解TCP/IP传输层拥塞控制算法
		0x00.前言 通过本文你将了解到以下内容: 拥塞控制概念以及其背景 流量控制和拥塞控制的区别与联系 拥塞控制主要过程详解 伙伴们认真学习一下,让offer来得更猛烈些吧! 0x01.TCP/IP协议 ... 
- 前端工程师如何理解 TCP/IP 传输层协议?
		网络协议是每个前端工程师都必须要掌握的知识,TCP/IP 中有两个具有代表性的传输层协议,分别是 TCP 和 UDP,本文将介绍下这两者以及它们之间的区别. TCP/IP网络模型 计算机与网络设备要相 ... 
- TCP/IP传输层,你懂多少?
		1. 传输层的主要功能是什么?2. 传输层如何区分不同应用程序的数据流?3. 传输层有哪些协议?4. 什么是UDP协议?5. 为什么有了UDP,还需要TCP?6. 什么是TCP协议?7. 怎么理解协议 ... 
- [TCP/IP] 传输层-TCP和UDP的使用场景
		传输层-TCP和UDP应用场景 TCP(传输控制协议) 需要将要传输的文件分段传输,建立会话,可靠传输,流量控制 UDP(用户报文协议) 一个数据包就能完成数据通信,不需要建立会话,不分段,不用流量控 ... 
- [TCP/IP] 传输层-ethereal 抓包分析TCP包
		开启抓包工具抓取一个HTTP的GET请求,我的ip是10.222.128.159 目标服务器ip是140.143.25.27 握手阶段: 客户端 ===> SYN MSS=1460(我能接 ... 
- 结合Wireshark捕获分组深入理解TCP/IP协议栈
		摘要: 本文剖析了浏览器输入URL到整个页面显示的整个过程,以百度首页为例,结合Wireshark俘获分组进行详细分析整个过程,从而更好地了解TCP/IP协议栈. 一.俘获分组 1.1 准 ... 
- 网络编程之TCP/IP各层详解
		网络编程之TCP/IP各层详解 我们将应用层,表示层,会话层并作应用层,从TCP/IP五层协议的角度来阐述每层的由来与功能,搞清楚了每层的主要协议,就理解了整个物联网通信的原理. 首先,用户感知到的只 ... 
- 简单理解TCP/IP协议
		一.什么是TCP/IP TCP/IP是一个协议族,是因为TCP/IP协议包括TCP.IP.UDP.ICMP.RIP.TELNETFTP.SMTP.ARP.TFTP等许多协议,这些协议一起称为TCP/I ... 
- 理解TCP/IP协议
		TCP/IP协议是Transmission Control Protocol/Internet Protocol的简写,中译名为传输控制协议/因特网互联协议. 单从TCP/IP协议这个名称看,好多人误 ... 
随机推荐
- Java数据类型(1)
			基本数据类型 A.整型 byte:(8位--1个字节 有符号 以二进制补码表示) 范围:-27~27-1 即 -128~127 short:(16位--2个字节 有符号 以二进制补码表示) 范围:-2 ... 
- javascript之DOM(一节点类型Node)
			DOM(Document Object Model)是针对HTML和XML文档的一个API.DOM描述的是一个层次化的节点树,允许开发人员添加.移除和修改页面的某一部分.起源于DHML,现为W3C的推 ... 
- Linux常用指定
			学前理论 linux主要特征 :一切且文件(目录.硬盘等都是文件):硬件都在/dev 目录,如硬盘.U盘为/dev/sd[a-d]: /dev/sr0(/dev/cdrom)是光驱的设备名(df命令查 ... 
- CentOS7编译安装Keepalived2.0.19
			实验环境:centos7 节点1:10.15.192.21 节点2:10.15.192.22 vip地址:10.15.192.23 1.下载文件 cd /usr/local/src wget http ... 
- php提示Undefined index的解决方法
			我们在做php开发时有时可能会提示Notice: Undefined index: *** on line 249,出现上面这些是 PHP 的提示而非报错,PHP 本身不需要事先声明变量即可直接使用, ... 
- ActiveMQ传输协议
			ActiveMQ默认的传输协议是TCP 在activemq的配置文件 /conf/activemq.xml可对配置文件进行修改和查看 
- JDOJ 2175: 忠诚2
			JDOJ 2175: 忠诚2 题目传送门 Description 老管家是一个聪明能干的人.他为财主工作了整整10年,财主为了让自已账目更加清楚.要求管家每天记k次账,由于管家聪明能干,因而管家总是让 ... 
- DIV 始终位于文档底部
			DIV 始终位于文档底部 设置body为绝对定位,最小显示高度为:100%,宽度为:100%: 设置底部显示块为绝对定位,bottom: 0,是body元素的最后一个直接子元素: 设置底部块元素同级元 ... 
- 【字符串】KMP
			Algorithm Task 给定一个文本串 \(S\) 和一个模式串 \(T\),求 \(T\) 在 \(S\) 中出现的所有位置. Limitations 要求时空复杂度均为线性. Solutio ... 
- day 19
			If you think you can, you can. And if you think you can't, you're right. 
