摘要

在详解http报文一文中，详细介绍了http报文的文本结构。那么作为服务端，web容器是如何解析http报文的呢？本文以jetty和undertow容器为例，来解析web容器是如何处理http报文的。

在前文中我们从概览中可以了解到，http报文其实就是一定规则的字符串，那么解析它们，就是解析字符串，看看是否满足http协议约定的规则。

start-line: 起始行,描述请求或响应的基本信息

*( header-field CRLF ): 头

CRLF

[message-body]: 消息body，实际传输的数据

jetty

以下代码都是jetty9.4.12版本

如何解析这么长的字符串呢，jetty是通过状态机来实现的。具体可以看下org.eclipse.jetty.http.HttpParse类

 public enum State

    {

        START,

        METHOD,

![](https://img2018.cnblogs.com/blog/1147363/201910/1147363-20191009220439773-204646534.png),

        SPACE1,

        STATUS,

        URI,

        SPACE2,

        REQUEST_VERSION,

        REASON,

        PROXY,

        HEADER,

        CONTENT,

        EOF_CONTENT,

        CHUNKED_CONTENT,

        CHUNK_SIZE,

        CHUNK_PARAMS,

        CHUNK,

        TRAILER,

        END,

        CLOSE,  // The associated stream/endpoint should be closed

        CLOSED  // The associated stream/endpoint is at EOF

    }

总共分成了21种状态，然后进行状态间的流转。在parseNext方法中分别对起始行 -> header -> body content分别解析

public boolean parseNext(ByteBuffer buffer)

    {

        try

        {

            // Start a request/response

            if (_state==State.START)

            {

                // 快速判断

                if (quickStart(buffer))

                    return true;

            }

            // Request/response line 转换

            if (_state.ordinal()>= State.START.ordinal() && _state.ordinal()<State.HEADER.ordinal())

            {

                if (parseLine(buffer))

                    return true;

            }

            // headers转换

            if (_state== State.HEADER)

            {

                if (parseFields(buffer))

                    return true;

            }

            // content转换

            if (_state.ordinal()>= State.CONTENT.ordinal() && _state.ordinal()<State.TRAILER.ordinal())

            {

                // Handle HEAD response

                if (_responseStatus>0 && _headResponse)

                {

                    setState(State.END);

                    return handleContentMessage();

                }

                else

                {

                    if (parseContent(buffer))

                        return true;

                }

            }

        return false;

    }

整体流程

整体有三条路径

开始 -> start-line -> header -> 结束
开始 -> start-line -> header -> content -> 结束
开始 -> start-line -> header -> chunk-content -> 结束

起始行

start-line = request-line(请求起始行）/（响应起始行）status-line

请求报文解析状态迁移

请求行：START -> METHOD -> SPACE1 -> URI -> SPACE2 -> REQUEST_VERSION
响应报文解析状态迁移

响应行：START -> RESPONSE_VERSION -> SPACE1 -> STATUS -> SPACE2 -> REASON

header 头

HEADER 的状态只有一种了，在jetty的老版本中还区分了HEADER_IN_NAM, HEADER_VALUE, HEADER_IN_VALUE等，9.4中都去除了。为了提高匹配效率，jetty使用了Trie树快速匹配header头。

static

    {

        CACHE.put(new HttpField(HttpHeader.CONNECTION,HttpHeaderValue.CLOSE));

        CACHE.put(new HttpField(HttpHeader.CONNECTION,HttpHeaderValue.KEEP_ALIVE));

      // 以下省略了很多了通用header头

content

请求体：

CONTENT -> END，这种是普通的带Content-Length头的报文，HttpParser一直运行CONTENT状态，直到最后ContentLength达到了指定的数量，则进入END状态
chunked分块传输的数据

CHUNKED_CONTENT -> CHUNK_SIZE -> CHUNK -> CHUNK_END -> END

undertow

undertow是另一种web容器，它的处理方式与jetty有什么不同呢

状态机种类不一样了，io.undertow.util.HttpString.ParseState

    public static final int VERB = 0;

    public static final int PATH = 1;

    public static final int PATH_PARAMETERS = 2;

    public static final int QUERY_PARAMETERS = 3;

    public static final int VERSION = 4;

    public static final int AFTER_VERSION = 5;

    public static final int HEADER = 6;

    public static final int HEADER_VALUE = 7;

    public static final int PARSE_COMPLETE = 8;

具体处理流程在HttpRequestParser抽象类中

public void handle(ByteBuffer buffer, final ParseState currentState, final HttpServerExchange builder) throws BadRequestException {

        if (currentState.state == ParseState.VERB) {

            //fast path, we assume that it will parse fully so we avoid all the if statements

            // 快速处理GET

            final int position = buffer.position();

            if (buffer.remaining() > 3

                    && buffer.get(position) == 'G'

                    && buffer.get(position + 1) == 'E'

                    && buffer.get(position + 2) == 'T'

                    && buffer.get(position + 3) == ' ') {

                buffer.position(position + 4);

                builder.setRequestMethod(Methods.GET);

                currentState.state = ParseState.PATH;

            } else {

                try {

                    handleHttpVerb(buffer, currentState, builder);

                } catch (IllegalArgumentException e) {

                    throw new BadRequestException(e);

                }

            }

			// 处理path

            handlePath(buffer, currentState, builder);

           // 处理版本

            if (failed) {

                handleHttpVersion(buffer, currentState, builder);

                handleAfterVersion(buffer, currentState);

            }

			// 处理header

            while (currentState.state != ParseState.PARSE_COMPLETE && buffer.hasRemaining()) {

                handleHeader(buffer, currentState, builder);

                if (currentState.state == ParseState.HEADER_VALUE) {

                    handleHeaderValue(buffer, currentState, builder);

                }

            }

            return;

        }

        handleStateful(buffer, currentState, builder);

    }

与jetty不同的是对content的处理，在header处理完以后，将数据放到io.undertow.server.HttpServerExchange,然后根据类型，有不同的content读取方式，比如处理固定长度的，FixedLengthStreamSourceConduit。

关注公众号【方丈的寺院】，第一时间收到文章的更新，与方丈一起开始技术修行之路

参考

http://www.blogjava.net/DLevin/archive/2014/04/19/411673.html

https://www.ph0ly.com/2018/10/06/jetty/connection/http-parser/

https://webtide.com/http-trailers-in-jetty/

http://undertow.io/undertow-docs/undertow-docs-2.0.0/

详解http报文（2）-web容器是如何解析http报文的的更多相关文章

详解Docker 端口映射与容器互联
详解Docker 端口映射与容器互联 1.端口映射实现访问容器 1.从外部访问容器应用在启动容器的时候,如果不指定对应的参数,在容器外部是无法通过网络来访问容器内部的网络应用和服务的. 当容器中运行 ...
Scrapy框架——介绍、安装、命令行创建，启动、项目目录结构介绍、Spiders文件夹详解（包括去重规则）、Selectors解析页面、Items、pipelines（自定义pipeline）、下载中间件（Downloader Middleware）、爬虫中间件、信号
一介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速.简单.可扩展的方式从网站中提取所需的数据.但目前Scrapy的用途十分广泛,可 ...
TCP/IP详解学习笔记（5）-- ICMP：internet 控制报文协议
1.概述 ICMP是(Internet Control Message Protocol)Internet控制报文协议.它是TCP/IP协议族的一个子协议,用于在IP主机.路由器之间传递控制 ...
详解 Nginx如何配置Web服务器
概述在高层次上,将NGINX配置作为Web服务器有一些问题需要了解,定义它处理哪些URL以及如何处理这些URL上的资源的HTTP请求. 在较低层次上,配置定义了一组控制对特定域或IP地址的请求的处理 ...
详解利用ELK搭建Docker容器化应用日志中心
概述应用一旦容器化以后,需要考虑的就是如何采集位于Docker容器中的应用程序的打印日志供运维分析.典型的比如SpringBoot应用的日志收集.本文即将阐述如何利用ELK日志中心来收集容器化应用 ...
TCP/IP详解卷一（第六章 ICMP：Internet控制报文协议）
ICMP是(Internet Control Message Protocol)Internet控制报文协议. 用于在IP主机.路由器之间传递控制消息.控制消息是指网络通不通.主机是否可达.路由是否可 ...
共享池之八：软解析、硬解析、软软解析详解一条SQL在library cache中解析涉及的锁
先来张大图: 结合上图来说明一下解析的各个步骤涉及的锁. 软解析.硬解析.软软解析区别的简单说明: 为了将用户写的sql文本转化为oracle认识的且可执行的语句,这个过程就叫做解析过程. 解析分为硬 ...
共享内存shared pool （5）：详解一条SQL在library cache中解析
前面介绍的 shared pool,library cache结构,都是为了说明一条SQL是如何被解析的.先看下面的图: 图中涉及的各结构简单介绍父HANDLE,里面有父游标堆0的地址.. 父游标堆 ...
Sqoop 使用详解（内含对官方文档的解析）
Sqoop 是 Cloudera 公司创造的一个数据同步工具,现在已经完全开源了. 目前已经是 hadoop 生态环境中数据迁移的首选,另外还有 ali 开发的 DataX 属于同类型工具,由于社区的 ...

随机推荐

vmware上安装的ubuntu连接不上网络
解决方法如下: 1.右键点击ubuntu,选择“设置” 2.网络适配器设置为“仅主机模式”:与主机共享的专用网络.点击“确定”即可.
HDU - 2121 Ice_cream’s world II 无根最小树形图
HDU - 2121 :http://acm.hdu.edu.cn/showproblem.php?pid=2121 比较好的朱刘算法blog:https://blog.csdn.net/txl199 ...
go Server示例
示例1: package main import ( "fmt" "log" "net/http" "time" ) f ...
使用Git初始化本地仓库并首次提交代码
本文介绍使用Git初始化本地仓库,并首次提交代码到远程仓库GitLab上面. 首先,登录GitLab,创建一个新项目的私人仓库: 然后,在本地仓库(就是你写代码文件夹),右键,Git Bash Her ...
Jmeter基础教程图文版（二）- 核心组件
⚪Jmeter Apache JMeter 是 Apache 组织开发的基于 Java 的压力测试工具.用于对软件做压力测试,它最初被设计用于 Web 应用测试,但后来扩展到其他测试领域. 它可以用于 ...
【Offer】[28] 【对称的二叉树】
题目描述思路分析测试用例 Java代码代码链接题目描述请实现一个函数,用来判断一-棵二叉树是不是对称的.如果一棵二叉树和它的镜像一样,那么它是对称的. 牛客网刷题地址思路分析利用前序 ...
Leetcode:合并两个有序链表
class Solution { public ListNode mergeTwoLists(ListNode l1, ListNode l2) { if (l1 == null) { return ...
基于soot的java方法名生成报告
0.生成XML格式文件笔者使用soot将java文件解析生成xml格式文档,具体操作流程不再赘述.本文讨论执行结果的用途.笔者第一次采用的java文件如下:文件名为test.java 用soot解析 ...
redis持久化的两种方式RDB和AOF
原文链接:http://www.cnblogs.com/tdws/p/5754706.html Redis的持久化过程中并不需要我们开发人员过多的参与,我们要做的是什么呢?除了深入了解RDB和AOF的 ...
webhook 自动部署代码
前话: 一般情况,自己在本地开发,代码改动后要push放到线上去看效果,但是我们还要到线上环境手动拉取代码库 git pull 下来, 一来一回太麻烦了. 现在用webhook就可以实现本地开发,pu ...

详解http报文（2）-web容器是如何解析http报文的

摘要