HTTP权威指南之连接管理
TCP连接
世界上几乎所有的 HTTP 通信都是由 TCP/IP 承载的, TCP/IP 是全球计算机及网络
设备都在使用的一种常用的分组交换网络分层协议集。 客户端应用程序可以打开一
条 TCP/IP 连接, 连接到可能运行在世界任何地方的服务器应用程序。 一旦连接建
立起来了, 在客户 端和服务器的计算机之间 交换的报文就永远不会丢失、 受损或
失序。尽管报文不会丢失或受损, 但如果计算机或网络崩溃了, 客户端和服务器之间的通信仍然会被断开。
在这种情况下, 会通知客户端和服务器通信中断了。
TCP 为 HTTP 提供了一条可靠 的比特传输管道。 从 TCP 连接一端填入的字节会从另
一端以原有的顺序、 正确地传送出来
HTTP 要传送一条报文时, 会以流的形式将报文数据的内容通过一条打开的 TCP 连
接按序传输。 TCP 收到数据流之后, 会将数据流砍成被称作段的小数据块, 并将段
封装在 IP 分组中, 通过因特网进行传输 所有这些工作都是由 TCP/
IP 软件来处理的, HTTP 程序员什么都看不到。
每个 TCP 段都是由 IP 分组承载, 从一个 IP 地址发送到另一个 IP 地址的。 每个 IP
分组中都包括:
• 一个 IP 分组首部(通常为 20 字节) ;
• 一个 TCP 段首部(通常为 20 字节) ;
• 一个 TCP 数据块( 0 个或多个字节)。
IP 首部包含了源和目 的 IP 地址、 长度和其他一些标记。 TCP 段的首部包含了 TCP
端口 号、 TCP 控制标记, 以及用于数据排序和完整性检查的一些数字值。
保持TCP连接的正确运行
在任意时刻计算机都可以有几条 TCP 连接处于打开状态。 TCP 是通过端口 号来保持
所有这些连接的正确运行的。
端口 号和雇员使用的电话分机号很类似。 就像公司的总机号码能将你接到前台, 而
分机号可以将你接到正确的雇员 位置一样, IP 地址可以将你连接到正确的计算机,
而端口 号则可以将你连接到正确的应用程序上去。 TCP 连接是通过 4 个值来识别的:
< 源 IP 地址、 源端口 号、 目 的 IP 地址、 目 的端口 号 >
这 4 个值一起唯一地定义了一条连接。 两条不同的 TCP 连接不能拥有 4 个完全相同
的地址组件值(但不同连接的部分组件 可以拥有相同的值)

HTTP 事务的时延有以下几种主要原因。
(1 ) 客户端首先需要根据 URI 确定 Web 服务器的 IP 地址和端口 号。 如果最近没有对
URI 中的主机名进行访问, 通过 DNS 解析系统将 URI 中的主机名转换成一个 IP
地址可能要花费数十秒的时间 3。
(2) 接下来, 客户端会向 服务器发送一条 TCP 连接请求, 并等待服务器回 送一个请
求接受应答。 每条新的 TCP 连接都会有连接建立时延。 这个值通常最多只有一
两秒钟, 但如果有数百个 HTTP 事务的话, 这个值会快速地叠加上去。
(3) 一旦连接建立起来了, 客户 端就会通过新建立的 TCP 管道来发送 HTTP 请求。
数据到达时, Web 服务器会从 TCP 连接中 读取请求报文, 并对请求进行处理。因特网传输请求报文,
以及服务器处理请求报文都需要时间。
(4) 然后, Web 服务器会回送 HTTP 响应, 这也需要花费时间。
这些 TCP 网络时延的大小取决于硬件速度、 网络和服务器的负载, 请求和响应报文
的尺寸, 以及客户端和服务器之间的距离。 TCP 协议的技术复杂性也会对时延产生
巨大的影响。
最常见的 TCP 相关时延,
其中包括:
• TCP 连接建立握手;
• TCP 慢启动拥塞控制;
• 数据聚集的 Nagle 算法;
• 用于捎带确认的 TCP 延迟确认算法;
• TIME_WAIT 时延和端口 耗尽。
TCP 连接握手需要经过以下几个步骤。
(1) 请求新的 TCP 连接时, 客户端要向服务器发送一个小的 TCP 分组(通常是 40 ~
60 个字节)。 这个分组中设置了一个特殊的 SYN 标记, 说明这是一个连接请求。
(2) 如果服务器接受了 连接, 就会对一些连接参数进行计算, 并向 客户端回 送一个
TCP 分组, 这个分组中 的 SYN 和 ACK 标记都被置位, 说明连接请求已被接受。
(3) 最后, 客户端向服务器回送一条确认信息, 通知它连接已成功建立。
现代的 TCP 栈都允许客户端在这个确认分组中发送数据。
程序员永远不会看到这些分组——这些分组都由 TCP/IP 软件管理, 对其是不
可见的。 HTTP 程序员看到的只是创建 TCP 连接时存在的时延。
通常 HTTP 事务都不会交换太多 数据, 此时, SYN/SYN+ACK 握手会产生一个可测量的时延。
TCP 连接的 ACK 分组 通常都足够大, 可以承载整个 HTTP 请求报文, 而且很多 HTTP 服务器响应报文都可
以放入一个 IP 分组中 去( 比如, 响应是包含了装饰性图 片的小型 HTML 文件, 或
者是对浏览器高速缓存请求产生的 304 Not Modified 响应)。
HTTP权威指南之连接管理的更多相关文章
- 和我一起学《HTTP权威指南》——连接管理
连接管理 1.TCP连接 几乎所有的HTTP通信都是由TCP/IP承载的. 浏览网页时客户端执行的操作: 如浏览http://www.joes-hardware.com:80/power-tools. ...
- HTTP权威指南读书笔记
HTTP权威指南笔记 读书有两种境界,第一种境界是将书读薄,另一种是读厚.本篇文章就是HTTP权威指南的读书笔记,算是读书的第一重境界,将厚书读薄.文章对HTTP的一些关键概念做了比较详细的概述,通读 ...
- 《HTTP权威指南》之HTTP连接管理及对TCP性能的考虑
在上一篇博客中(<HTTP权威指南>之HTTP相关概念详解)我们简单对HTTP相关的基本概念做了一些简单的了解,但未对HTTP连接管理的内容做一些详细的介绍.本篇博客我们就一起来看一下HT ...
- 《Ansible权威指南》笔记(3)——Ad-Hoc命令集,常用模块
五.Ad-Hoc命令集1.Ad-Hoc命令集通过/usr/bin/ansible命令实现:ansible <host-pattern> [options] -v,--verbose ...
- 《Ansible权威指南》笔记(1)——安装,ssh密钥登陆,命令
2016-12-23 读这本<Ansible权威指南>学习ansible,根据本书内容和网上的各种文档,以及经过自己测试,写出以下笔记.另,这本书内容很好,但印刷错误比较多,作者说第二版会 ...
- HTTP连接管理
本文是<HTTP权威指南>读书笔记: 几乎所有的HTTP通信都是通过TCP/IP承载的,当HTTP要传送一些报文时,会以流的形式将报文数据的内容通过一条打开的TCP连接按序传输.因此HTT ...
- Netty权威指南
Netty权威指南(异步非阻塞通信领域的经典之作,国内首本深入剖析Netty的著作,全面系统讲解原理.实战和源码,带你完美进阶Netty工程师.) 李林锋 著 ISBN 978-7-121-233 ...
- Android开发权威指南(第2版)新书发布
<Android 开发权威指南(第二版)>是畅销书<Android开发权威指南>的升级版,内容更新超过80%,是一本全面介绍Android应用开发的专著,拥有45 章精彩内容供 ...
- Hadoop权威指南:HDFS-数据流
Hadoop权威指南:HDFS-数据流 [TOC] 剖析文件读取 客户端通过调用FileSystem对象的open()方法来打开希望读取的文件,对于HDFS来说, 这个对象是分布式文件系统的一个实例 ...
随机推荐
- linux概念之IPC
一切皆文件,文件类型为普通,目录,管道,socket,链接,块设备,字符设备cd /proc/2305/fd/ 该进程打开了6个文件描述符,三个为字符设备即012,三个为socket即345,sock ...
- Hadoop 源码编译导出
https://svn.apache.org/repos/asf/hadoop/common/branches/branch-trunk-win/BUILDING.txt http://www.src ...
- DW(二):SqlServer PDW
当微软发布第一个SQL Server并行数据仓库R2时(SQL ServerParallel Data Warehouse,即PDW),已正式将产品的名称修改为分析服务平台(APS),但在一些非正式场 ...
- openstack命令行
openstack的每一个子项目(project)都有自己对应的命令行API,所有的这些API都是基于RESTful的,python代码实现的API.也就是说,这些API都是基于HTTP实现的,所以A ...
- http meta
定义和用法 <meta> 元素可提供有关页面的元信息(meta-information),比如针对搜索引擎和更新频度的描述和关键词. <meta> 标签位于文档的头部,不包含任 ...
- 在程序中使用gettid()的方法
gettid()这个函数不可以在程序中直接使用,它是linux本身的一个函数,直接使用会出现,尚未声明之类的错误. 我们可以自已定义实现方法,如下: #include <sys/syscall. ...
- 【linux】grub详解
参数解释 1. default=0 # default后加一个数字n,表示n+1个“title”操作系统,0表示第一个“title” 的操作系统,以此类推. 2. timeout=0 # timeou ...
- erlang远程加载模块须知
erlang加载本地beam到远程节点,需要把依赖库一个个手动加载,否则他不会自动加载. 另外,创建lib的话,使用 rebar-creator create-lib
- android打印调用栈
在某些机器上,不能下断点,出现了某个诡异的问题,想到唯一的解决方式,就是打印调用栈了,google发现这个,记录下,以后备用 Log.d(",Log.getStackTraceString( ...
- TCP中需要了解的东西
1.TCP是一个流协议. TCP跟UDP不一样的是,TCP发送过去的东西是stream,也就是说第一次发送的跟第二次发送的数据包可能会粘在一起,即所谓的粘包问题 http://blog.csdn.ne ...