简介

webserver往小里说核心功能就是socket管理、url处理、http协议处理、业务dll管理等;下面简介绍一下http协议:超文本传输协议(HTTP)是一种通信协议,当时就是为web传输设计的一个基于tcp的协议;基于这个字面上理解,可以简单的点说就是用tcp来传输文本、数据的一种编解码格式。传输协议一般比如说定个长度+内容,或者以回车符作为结尾等方式。http协议是文本传输协议,所以也是采用回车符来结尾的方式来实现编码传输解析的; 这里使用分析工具来简单分析一下http的基本格式:

从上图可以看出http的基本格式一般大体为成header和body,header的第一行是固定的status line,header与body之间用回车符+空行+回车符来分隔的

GET

webserver一般收到get请求如下:

1  GET /yswenli/p/8858669.html HTTP/1.1
2 Host www.cnblogs.com
3 User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36 Accept image/webp,image/*,*/*;q=0.8
4 Referer https://www.cnblogs.com/yswenli/p/8858669.html
5 Accept-Encoding gzip, deflate, sdch
6 Accept-Language zh-CN,zh;q=0.8

也就是说如果发起了一个get请求的时候,webserver只是收到一个一个http header,直接全部收取后解析就行

POST

如果是一个post请求呢?查看html相关内容,可以看post有很多方式,总体上分成三种,一种是默认的application/x-www-form-urlencoded:

 POST http://www.example.com HTTP/1.1
Content-Type: application/x-www-form-urlencoded;charset=utf- title=test&sub%5B%5D=&sub%5B%5D=&sub%5B%5D=

这种格式就是带有header和body两部分内容,解析的时候可以先按get收头部,然后再取body,body里面的参数取值是先urldecode再htmldecode就可以了。

第二种就是json、xml、plaine等:

 POST http://www.example.com HTTP/1.1
Content-Type: application/json;charset=utf- {"title":"test","sub":[,,]}

这种和上面类似,不过在取body的时候直接读就行~

还有第三种multipart/form-data,这种模式格式比较复杂,它支持多键值对、多文件的方式,使用特定的boundary来分隔body

 POST http://www.example.com HTTP/1.1
Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA ------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="name" yswenli
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="file"; filename="chrome.png"
Content-Type: image/png PNG ... content of chrome.png ...
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="text" title
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="file"; filename="chrome2.png"
19 Content-Type: image/png PNG ... content of chrome.png ...
------WebKitFormBoundaryrGKCBY7qhFd3TrwA--

这种格式也是带有header和body两部分内容,解析的时候先按get收头部,然后再取body,body里面的内容先按boundry进行分割,然后再根据content-type进行判断取出文件内容。

TCP转HTTP

即然拿到相关数据格式,并研究分析了http的编码格式,下面就可以开始解码了。首先使用一个data来接收socket的tcp数据包,然后统一分析http包的header,直到截取到\r\n+""+\r\n为止。

             using (MemoryStream ms = new MemoryStream(buffer))
{
ms.Position = ; using (SAEA.Common.StreamReader streamReader = new SAEA.Common.StreamReader(ms))
{
while (true)
{
var str = streamReader.ReadLine();
if (str == string.Empty)
{
this.HeaderStr = _stringBuilder.ToString();
_stringBuilder.Clear();
break;
}
else if (str == null && string.IsNullOrEmpty(this.HeaderStr))
{
return false; }
else
_stringBuilder.AppendLine(str);
}
}
}

上面使用了一个自定义的StreamReader,原因是自带的那个无法定位Stream的Position;若已成功解析出http的header,接下来就可以根据header来判断提交的方式是get还是post等。

         /// <summary>
/// 解析http请求的数据
/// </summary>
/// <param name="data"></param>
/// <param name="onUnpackage"></param>
public void GetRequest(byte[] data, Action<RequestDataReader> onUnpackage)
{
lock (_locker)
{
_cache.AddRange(data); var buffer = _cache.ToArray(); if (!isAnalysis)
{
isAnalysis = _httpStringReader.Analysis(buffer);
}
if (isAnalysis)
{
//post需要处理body
if (_httpStringReader.Method == ConstString.POSTStr)
{
var contentLen = _httpStringReader.ContentLength;
var positon = _httpStringReader.Position;
var totlalLen = contentLen + positon;
if (buffer.Length == totlalLen)
{
_httpStringReader.AnalysisBody(buffer);
onUnpackage.Invoke(_httpStringReader);
Array.Clear(buffer, , buffer.Length);
buffer = null;
_cache.Clear();
_cache = null;
}
}
else
{
onUnpackage.Invoke(_httpStringReader);
Array.Clear(buffer, , buffer.Length);
buffer = null;
_cache.Clear();
_cache = null;
}
}
}
}

已解析header的话,就可以根据上面说的相关post的http数据格式来解析body。

                switch (this.ContentType)
{
case ConstString.FORMENCTYPE1:
this.Forms = GetRequestForms(Encoding.UTF8.GetString(this.Body));
break;
case ConstString.FORMENCTYPE2:
//todo
using (MemoryStream ms = new MemoryStream(this.Body))
{
ms.Position = ;
using (var sr = new SAEA.Common.StreamReader(ms))
{
StringBuilder sb = new StringBuilder();
var str = string.Empty;
do
{
str = sr.ReadLine();
if (str == null)
{
break;
}
else
{
sb.AppendLine(str);
if (str.IndexOf(CT) > -)
{
var filePart = GetRequestFormsWithMultiPart(sb.ToString()); if (filePart != null)
{
sr.ReadLine(); filePart.Data = sr.ReadData(sr.Position, this.Boundary);
if (filePart.Data != null)
{
filePart.Data = filePart.Data.Take(filePart.Data.Length - ).ToArray();
}
if (this.PostFiles == null)
this.PostFiles = new List<FilePart>();
this.PostFiles.Add(filePart);
}
sb.Clear();
sr.ReadLine();
}
}
}
while (true); }
}
break;
default:
this.Json = Encoding.UTF8.GetString(this.Body);
break;
}

至此,http的相关解析就完成了,详细的代码可参见:

1.HCode主要功能收取tcp包、

2.RequestDataReader主要功能是收到的tcp包近http协议转成webrequest、

3.HttpRequest主要功能是将转换的数据进行model赋值、

4.HttpContext主要功能是映射到处理业务并返回http数据

转载请标明本文来源:https://www.cnblogs.com/yswenli/p/9326453.html
更多内容欢迎star/fork作者的github:https://github.com/yswenli/SAEA
如果发现本文有什么问题和任何建议,也随时欢迎交流~

动手做webserver的核心之http解析的更多相关文章

  1. IP工具类-自己动手做个ip解析器

    IP工具类-自己动手做个ip解析器 一.资料准备 导入依赖包:

  2. 自己动手做AI:Google AIY开发工具包解析

    2018年国际消费性电子展(CES)上,最明显的一个趋势是Amazon与Google的语音技术进驻战,如AmazonAlexa进驻到Acer笔电内,Google Assist进驻到KIA汽车内,其他如 ...

  3. 线程安全使用(四) [.NET] 简单接入微信公众号开发:实现自动回复 [C#]C#中字符串的操作 自行实现比dotcore/dotnet更方便更高性能的对象二进制序列化 自已动手做高性能消息队列 自行实现高性能MVC WebAPI 面试题随笔 字符串反转

    线程安全使用(四)   这是时隔多年第四篇,主要是因为身在东软受内网限制,好多文章就只好发到东软内部网站,懒的发到外面,现在一点点把在东软写的文章给转移出来. 这里主要讲解下CancellationT ...

  4. 【雕爷学编程】MicroPython动手做(04)——零基础学MaixPy之尝试运行

    1.hello micropython #MicroPython动手做(04)——零基础学MaixPy之基本示例 #程序之一:hello micropython #MicroPython动手做(04) ...

  5. 【雕爷学编程】MicroPython动手做(01)——春节后入手了K210开发板

    Python的开放.简洁.黏合正符合了现发展阶段对人工智能.大数据分析.可视化.各种平台程序协作产生了快速的促进作用.自Python3的发布到现在已有五六年的时间,从刚发布的反对声音到慢慢被接受与喜欢 ...

  6. 【雕爷学编程】Arduino动手做(58)---SR04超声波传感器

    37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的.鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为 ...

  7. 【雕爷学编程】Arduino动手做(56)---8路LED跑马灯模块

    37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器和模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里 ...

  8. 【雕爷学编程】Arduino动手做(45)---红外避障传感器

    37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器和模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里 ...

  9. 「雕爷学编程」Arduino动手做(33)——ESP-01S无线WIFI模块

    37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器和模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里 ...

随机推荐

  1. PHP对接淘宝客api完成APP引流优惠券

    淘宝客现在对多数人来说已经耳熟能详了,属于CPS(Cost Per Sale),一种网络广告收费标准,以实际销售产品数量来换算广告刊登金额.其他收费标准还有常见的CPC(Cost Per Click ...

  2. docker研究-1

    Docker是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的.可移植的.自给自足的容器.开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署,包括VMs(虚拟机).bare metal. ...

  3. AWS专线服务总结和疑问

    1.AWS专线服务的入口, 从介绍页上可以看到,有如下功能: (1)专线可以连接AWS云主机和传统的数据中心或者分支机构. (2)专线可以连接AWS云主机和托管区的主机. 连接要素: (1)需要使用V ...

  4. Physical Plausible Shading

    问所有人一个简单的问题,为什么我们做片子,CG生产的效果,就是不如论文中样图结果.难道是论文中用了某些神奇的黑科技?或者是依赖PS伪造的图?你当然不可能怀疑Cornell.Stanford这些一流机构 ...

  5. 2016-04-25-信息系统实践手记5-CACHE设计一例

    layout: post title: 2016-04-25-信息系统实践手记5-CACHE设计一例 key: 20160425 tags: 业务 场景 CACHE 系统分析 系统设计 缓存 modi ...

  6. windows网络编程中文 笔记(一)

    OSI网络模型 OSI(Open System Interconnection)开放系统互联 第七层 应用层 为用户提供相应的界面,以便使用提供的连网功能 第六层 表示层 完成数据的格式化 第五层 会 ...

  7. Tomcat8-windows不能在本地计算机启动tomcat,有更多的信息,查阅系统事件日志。

    tomcat启动不了,也卸载不了. 本人的一个解决方法: 本来jdk和jre是装在g盘的同一个文件夹里的,后来删了他们.再安装的时候jdk安装回原来的地方,jre安装到c盘. 现在需要卸载到他们,重新 ...

  8. 前后端分离djangorestframework——路由组件

    在文章前后端分离djangorestframework——视图组件 中,见识了DRF的视图组件强大,其实里面那个url也是可以自动生成的,就是这么屌 DefaultRouter urls文件作如下调整 ...

  9. windows下安装consul

    Consul 是一个支持多数据中心分布式高可用的服务发现和配置共享的服务软件, 由 HashiCorp 公司用 Go 语言开发, 基于 Mozilla Public License 2.0 的协议进行 ...

  10. 使用 dep 配置 golang 开发环境

    概要 golang 的包管理一直没有官方统一的解决方案,因此也产生了很多非官方的包管理工具. 之前我一直使用的 gb(https://getgb.io/) 能够很好的隔开各个 golang 工程,当时 ...