[httpserver]如何解析HTTP请求报文
这个http server的实现源代码我放在了我的github上,有兴趣的话可以点击查看哦。
在上一篇文章中,讲述了如何编写一个最简单的server,但该程序只是接受到请求之后马上返回响应,实在不能更简单。在正常的开发中,应该根据不同的请求做出不同的响应。要做到上述的功能,首先要解析客户端发来的请求报文。
报文在不同的上下文情景下有不同的理解,本文所说的报文都是在HTTP上下文中描述的名词。
HTTP报文是什么
在HTTP程序中,报文就是HTTP用来搬运东西的包裹,也可以理解为程序之间传递信息时发送的数据块。这些数据块以一些文本形式的元信息开头,这些信息描述了报文的内容和含义,后面跟着可选的数据部分。
报文的流动
HTTP使用属于流入和流出来描述报文的传递方向。HTTP报文会像合水一样流动。不管时请求报文还是响应报文,都会向下游流动,所有报文的发送者都在接受者的上游。下图展示了报文向下游流动的例子。

报文的组成
报文由三个部分组成:
- 对报文进行描述的起始行
- 包含属性的首部块
- 可选的、包含数据的主体部分
起始行和首部是由行分隔的ASCII文本。每行都以一个由两个字符(回车符--ASCII码13和换行符--ASCII码10)组成的行终止序列结束。可以写做CRLF。
尽管规范说明应该用CRLF来表示行终止,但稳健的应用程序也应该接受单个换行作为行的终止。笔者仅支持以CRLF换行的解析,因为我觉得既然有了规范,那就需要遵循,遵循相同的协议的程序才能互相通信。
实体是一个可选的数据块。与起始行和首部不同的是,主体中可以包含主体或二进制数据,也可以为空(比如仅仅GET一个页面或文件)。
下面来看看报文的语法的格式和规则。
报文的语法
请求报文的语法:
<method> <request-URL> <version>
<headers>
<entity-body>
响应报文的语法:
<version> <status-code> <reason-phrase>
<headers>
<entity-body>
method,方法
客户端希望服务器对资源执行的操作。比如GET、POST
request-URL,请求URL
请求资源,或者URL路径组件的完整URL。
version,版本
报文所使用的HTTP版本。格式:HTTP/.。其中major(主要版本号)和minor(次要版本号)都是整数。
status-code,状态码
描述请求过程所发生的情况的数字。
reason-phrase,原因短语
数字状态码的文字描述版本。
headers,首部
每个首部包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个CRLF。可以有零个或多个首部。首部由一个CRLF结束,表示首部结束和实体主体开始。
entity-body,实体的主体部分
包含一个由任意数据组成的数据块。可以没有,此时是以一个CRLF结束。
请求行
请求报文的起始行称为请求行。所有的HTTP报文都以一行起始行作为开始。请求行包含一个方法和一个请求URL以及HTTP的版本三个字段。每个字段都以空格分隔。
比如:GET / HTTP/1.1。
请求方法为GET,请求URL为/,HTTP版本为HTTP/1.1。
响应行
响应报文的起始行称为响应行。响应行包含HTTP版本、数字状态码以及描述操作状态的文本形式的原因短语。三个字段也是以空格分隔。
比如:HTTP/1.1 200 OK。
HTTP版本为HTTP/1.1,数字状态码是200,原因短语是OK。表示请求成功。
首部
首部是是包含在请求和响应报文的一些附加信息。本质上,他们只是一些键值对的列表。
比如:Content-Length: 19
表示返回内容长度为19。
实体的主体部分
简单地说,这部分就是HTTP要传输的内容。
解析请求报文
了解了报文是如何组成和各部分代表的内容之后,就对如何解析请求报文心里有数了。
核心代码
/* 解析请求行 */
int parse_start_line(int sockfd, char *recv_buf, req_pack *rp)
{
char *p = recv_buf;
char *ch = p;
int i = 0;
enum parts { method, url, ver } req_part = method;
char *method_str;
char *url_str;
char *ver_str;
int k = 0;
if (*ch < 'A' || *ch > 'Z') {
return -1;
}
while (*ch != CR) {
if (*ch != BLANK) {
k++;
} else if (req_part == method) {
method_str = (char *)malloc(k * sizeof(char *));
memset(method_str, 0, sizeof(char *));
strncpy(method_str, recv_buf, k);
k = 0;
req_part = url;
} else if (req_part == url) {
url_str = (char *)malloc(k * sizeof(char *));
memset(url_str, 0, sizeof(char *));
strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
k = 0;
req_part = ver;
}
ch++;
i++;
}
if (req_part == url) {
if (k != 0) {
url_str = (char *)malloc(k * sizeof(char));
memset(url_str, 0, sizeof(char));
strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
k = 0;
} else {
return -1;
}
}
if (k == 0) {
ver_str = (char *)malloc(8 * sizeof(char));
memset(ver_str, 0, sizeof(char));
strcpy(ver_str, "HTTP/1.1");
} else {
ver_str = (char *)malloc(k * sizeof(char));
memset(ver_str, 0, sizeof(char));
strncpy(ver_str,
recv_buf + strlen(method_str) + strlen(url_str) + 2, k);
}
rp->method = method_str;
rp->url = url_str;
rp->version = ver_str;
return (i + 2);
}
/* 解析首部字段 */
int parse_header(int sockfd, char *recv_buf, header headers[])
{
char *p = recv_buf;
char *ch = p;
int i = 0;
int k = 0;
int v = 0;
int h_i = 0;
bool is_newline = false;
char *key_str;
char *value_str;
header *tmp_header = (header *)malloc(sizeof(header *));
memset(tmp_header, 0, sizeof(header));
while (1) {
if (*ch == CR && *(ch + 1) == LF) {
break;
}
while (*ch != COLON) {
ch++;
i++;
k++;
}
if (*ch == COLON) {
key_str = (char *)malloc(k * sizeof(char *));
memset(key_str, 0, sizeof(char *));
strncpy(key_str, recv_buf + i - k, k);
k = 0;
ch++;
i++;
}
while (*ch != CR) {
ch++;
i++;
v++;
}
if (*ch == CR) {
value_str = (char *)malloc(v * sizeof(char *));
memset(value_str, 0, sizeof(char *));
strncpy(value_str, recv_buf + i - v, v);
v = 0;
i++;
ch++;
}
i++;
ch++;
headers[h_i].key = key_str;
headers[h_i].value = value_str;
h_i++;
}
return (i + 2);
}
解析思想
遍历recv接受到的请求字符串,检查是否遇到回车符\r判断一行数据。
对于起始行,检查是否遇到空格分隔不同的字段;对于首部,检查是否遇到冒号分隔键值对的字段值;对于实体的主体部分,则先判断是否遇到CRLF字符串,然后将剩余内容全部作为实体的主体部分。
返回值是告知程序下一次遍历的起始位置。
如果遇到非法请求行则返回400的响应。
总结
解析报文的过程就是遵循HTTP协议规定的内容去解析报文,获取报文包含的信息。
由于基础知识较薄弱,代码还有很多错误以及很多地方需要优化。如果有看到错误的地方或有其它建议望各位大侠不吝赐教。^_^
这个http server的实现源代码我放在了我的github上,有兴趣的话可以点击查看哦。
原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。
如果本文对你有帮助,请点下推荐吧,谢谢^_^
[httpserver]如何解析HTTP请求报文的更多相关文章
- HTTP POST请求报文格式分析与Java实现文件上传
时间 2014-12-11 12:41:43 CSDN博客 原文 http://blog.csdn.net/bboyfeiyu/article/details/41863951 主题 HTTPHt ...
- http请求报文格式和响应报文格式
转载 出处 超文本传输协议(Hypertext Transfer Protocol,简称HTTP)是应用层协议.HTTP 是一种请求/响应式的协议,即一个客户端与服务器建立连接后,向服务器发送一个请求 ...
- spring-boot 使用Aop通知打印控制器请求报文和返回报文
一.简介 开发过程中我们往往需要写许多例如: @GetMapping("/id/get") public Result getById( String id) throws Exc ...
- TIdHTTP get参数带中文解决方法--请求报文
Post 看起来稍微复杂先,暂不讨论.post 目前按照一般方法有中文名也可以. 拼接时:pointname=九记餐厅&begintime=2017-03-01 00:00:00& 有 ...
- HTTP的请求报文与响应报文
报文: 简单来说,报文就是也就是HTTP报文,作用是在各个系统之间进行和响应时用来交换与传输的数据单元,即站点一次性要发送的数据块,这些数据块以一些文本形式的元信息开头,这些信息描述了报文的内容及含义 ...
- 011-通过网络协议解析网络请求-DNS-ARP-TCPIP
一.概述 1.1.tcp/ip概述 TCP/IP不是一个协议,而是一个协议族的统称.里面包括IP协议.IMCP协议.TCP协议.跨越了多层模型的多层 TCP/IP协议族按照层次由上到下,层层包装.最上 ...
- Python http.server中获取Post的请求报文
今天在自学http.server请求命令, 各个字段都很好理解, 但唯独想打印获取Post请求报文时, 被难住了, 网上找了很多帖子, 官方的文档也刷了几遍, 但没有一个明确的答复. 后来不经意间看到 ...
- HTTP请求协议中请求报文(Request Headers)跟响应报文(Response Headers)的简单理解
背景 今儿个一新来的应届生问我,开发模式中所看到的web请求的请求头里的属性怎么理解,我便根据自己的经验随便拉开一个请求跟他聊了起来,顺便自己记录下文字版,以后再有交流直接发地址给他就好了,嘻嘻,机智 ...
- http请求报文格式(请求行、请求头、空行 和 请求包体)和响应报文格式(状态行、响应头部、空行 和 响应包体)
转载 出处 超文本传输协议(Hypertext Transfer Protocol,简称HTTP)是应用层协议.HTTP 是一种请求/响应式的协议,即一个客户端与服务器建立连接后,向服务器发送一个请求 ...
随机推荐
- C#与C++的发展历程第三 - C#5.0异步编程巅峰
系列文章目录 1. C#与C++的发展历程第一 - 由C#3.0起 2. C#与C++的发展历程第二 - C#4.0再接再厉 3. C#与C++的发展历程第三 - C#5.0异步编程的巅峰 C#5.0 ...
- C++中的变长参数
新参与的项目中,为了使用共享内存和自定义内存池,我们自己定义了MemNew函数,且在函数内部对于非pod类型自动执行构造函数.在需要的地方调用自定义的MemNew函数.这样就带来一个问题,使用stl的 ...
- Unity游戏内版本更新
最近研究了一下游戏内apk包更新的方法. ios对于应用的管理比较严格,除非热更新脚本,不太可能做到端内大版本包的更新.然而安卓端则没有此限制.因此可以做到不跳到网页或应用商店,就覆盖更新apk包. ...
- favicon.ioc使用以及注意事项
1.效果 2.使用引入方法 2.1 注意事项:(把图标命名为favicon.ico,并且放在根目录下,同时使用Link标签,多重保险) 浏览器默认使用根目录下的favicon.ico 图标(如果你并没 ...
- Android注解使用之通过annotationProcessor注解生成代码实现自己的ButterKnife框架
前言: Annotation注解在Android的开发中的使用越来越普遍,例如EventBus.ButterKnife.Dagger2等,之前使用注解的时候需要利用反射机制势必影响到运行效率及性能,直 ...
- ASP.NET Core的路由[1]:注册URL模式与HttpHandler的映射关系
ASP.NET Core的路由是通过一个类型为RouterMiddleware的中间件来实现的.如果我们将最终处理HTTP请求的组件称为HttpHandler,那么RouterMiddleware中间 ...
- 12、Struts2表单重复提交
什么是表单重复提交 表单的重复提交: 若刷新表单页面, 再提交表单不算重复提交. 在不刷新表单页面的前提下: 多次点击提交按钮 已经提交成功, 按 "回退" 之后, 再点击 &qu ...
- 一个诡异的COOKIE问题
今天下午,发现本地的测试环境突然跑不动了,thinkphp直接跑到异常页面,按照正常的排错思路,直接看thinkphp的log 有一条 [ error ] [2]setcookie() expects ...
- [开发笔记]yum错误
yum 错误TypeError: rpmdb open failed 解决办法 是因为RPM数据库出现损坏导致的,它导致所有的软件的升级.安装甚至是删除都会出现问题,终端出现乱码,YUMEX也用不成, ...
- WebSocket - ( 一.概述 )
说到 WebSocket,不得不提 HTML5,作为近年来Web技术领域最大的改进与变化,包含CSS3.离线与存储.多媒体.连接性( Connectivity )等一系列领域,而即将介绍的 WebSo ...