HTTP CHUNKED C实现
C语言不像C#一样有很多很多高度的模块化的东西可以使用,在通讯过程中特别是与http相关的通讯过程中可能要对网站返回的数据做一定处理,而且有不少网站的回应是强制性的,例如向网站请求deflate有个能会返回的是gzip的数据。在这过程中与web特性有关的,在服务器构造消息之前可能并不知道或者不方便知道消息的长度,于是就会将消息分为一段段进行传送。
例如如下回应:

不难发现,chunked正式实现这一思想的方式。
每个HTTP头部含有Transfer-Encoding: chunked则表明此包Data是分块传输的。关于他的介绍痿基百科上说的很多,有兴趣可以看看http://en.wikipedia.org/wiki/Chunked_transfer_encoding
实质上我们做的工作就是要对HTTP返回的头部含有Transfer-Encoding: chunked的数据做解码工作。
数据结构如下:长度[HEX]\r\n内容\r\n长度[HEX]\r\n内容\r\n\0\r\n\r\n
解码过程当然很简单,没涉及任何数学知识,或者更本谈不上解码,只是做合并工作罢了。。。
C语言能用的找了10分钟百度不到,除了一段满是奇怪参缺少函数的数狗啃的,索性干脆自己写一个算了。。。
以下是C(C++)实现代码,在1块长度112下测试通过,应该没什么BUG。有的话烦请只出,代码应该算得上严谨了。
/*
* 十六进制表示的字符串转换为相应的十进制值 传入"7f"返回127
*/
int htoi(unsigned char *s)
{
int i;
int n = ;
if (s[] == '' && (s[]=='x' || s[]=='X')) //判断是否有前导0x或者0X
{
i = ;
}
else
{
i = ;
}
for (; (s[i] >= '' && s[i] <= '') || (s[i] >= 'a' && s[i] <= 'z') || (s[i] >='A' && s[i] <= 'Z');++i)
{
if (tolower(s[i]) > '')
{
n = * n + ( + tolower(s[i]) - 'a');
}
else
{
n = * n + (tolower(s[i]) - '');
}
}
return n;
} /*
* 查找关键数据串在长数据中出现的位置
* 参数:1长数据指针,2搜索最大长度,3关键字指针,4关键字长度,5搜索起始位置(返回出现位置,若未找到则不变)
* 返回:返回1 成功 返回 0 未找到
*/
int _find_key(unsigned char *data,int data_length,unsigned char *key,int key_length,int *position)
{
int i = *position;
if(key == NULL || i<)
{
return ;
}
for(; i <= data_length-key_length; i++)
{
if( memcmp(data+i, key, key_length) == )
{
*position = i;
return ;
}
}
return ;
} /*
* 对HTTP的chunked消息进行合块
* 参数:1待处理数据,2数据长度(分配的长度即可,不一定要求出实际有效长度),3返回合块后的数据,4合块长度
* 算法具有前驱性,返回和传入data可以是同一块内存区域(不建议)
*/
int de_chunked(unsigned char *data,int data_length,unsigned char *dest,int *dest_length)
{
char chunked_hex[CHUNKED_MAX_LEN + ]; // 十六进制的块长度
int chunked_len; // 块长度
int ret;
int begin = ;
int end = ;
int i = ;
int index = ; ret = _find_key(data,data_length,"0\r\n\r\n",,&end);
if (ret == ) //信息不完整
return ; ret = _find_key(data,data_length,"\r\n\r\n",,&begin);
begin = begin + ; //移动到数据起点 while(memcmp(data+begin,"0\r\n\r\n",) != )
{
//获得当前块长度
ret = _find_key(data+begin,CHUNKED_MAX_LEN,"\r\n",,&i);
if (ret == ) //信息不完整
return ;
memcpy(chunked_hex,data+begin,i);
chunked_hex[i] = '\0';
chunked_len = htoi(chunked_hex);
//移动到当前块数据段
begin = begin + i + ;
//获得当前块数据
if (memcmp(data+begin+chunked_len,"\r\n",) != )
return ; //信息有误
memcpy(dest+index,data+begin,chunked_len);
index = index + chunked_len;
//移动到下一块块长度
begin = begin + chunked_len + ;
i = begin;
if(begin > end) //结构错误
return -;
}
*dest_length = index;
return ;
}
HTTP CHUNKED C实现的更多相关文章
- Transfer-Encoding: chunked
Http1.1中 使用 chunked 编码传送时 没有CONTENT_LENGTH,下载之前无法确定要下载的大小. Wininet中已经内嵌该传输协议,要查看chunked块的大小只能socket底 ...
- NSString asscii格式(2进制) 转 utf8格式——解决iOS自己处理http socket数据,遇到Transfer-Encoding: chunked时
因为需要实现自己的http客户端,就要自己模拟http 的socket通讯: 上行不难,自己处理好http即可. 但下行时,服务器端的动态语言返回数据有可能会是这种格式: http头 16进制表示的数 ...
- HTTP协议的chunked编码
一般情况HTTP的Header包含Content-Length域来指明报文体的长度.如: 有时候服务生成HTTP回应是无法确定消息大小的,比如大文件的下载,或者后台需要复杂的逻辑才能全部处理页面的请求 ...
- 取消掉Transfer-Encoding:chunked
先说解决方法:::不让服务器返回Transfer-Encoding:chunked,在客户端请求的时候可以使用http 1.0的协议. 有时候,Web服务器生成HTTP Response是无法在Hea ...
- 使用SourceTree Push 出现 POST git-receive-pack (chunked) 的解决方法
在使用SourceTree上传资料的时候,遇到 POST git-receive-pack (chunked) 从 stackoverflow 看到这样一则 This is a bug in Git; ...
- 分块编码(Transfer-Encoding: chunked)
参考链接: HTTP 协议中的 Transfer-Encoding 分块传输编码 一.背景: 持续连接的问题:对于非持续连接,浏览器可以通过连接是否关闭来界定请求或响应实体的边界:而对于持续连接,这种 ...
- GET 请求复制转发一直等待响应的问题 Transfer-Encoding: chunked
今天在做Proxy 转发请求的时候发现 GET的请求转发时一直在等待输出. 而Post等其它操作是可以的. 同事告诉我一般一直等待响应可能是输出内容长度和头部ContentLength不一致导致的, ...
- 容易被忽视的后端服务 chunked 性能问题
容易被忽视的后端服务 chunked 性能问题 标签(空格分隔): springboot springmvc chunked 背景 spring boot 创建的默认 spring mvc 项目 集成 ...
- HTTP协议扫盲(八 )响应报文之 Transfer-Encoding=chunked方式
一.什么是chunked编码? 分块传输编码(Chunked transfer encoding)是只在HTTP协议1.1版本(HTTP/1.1)中提供的一种数据传送机制.以往HTTP的应答中数据是整 ...
随机推荐
- IGS_学习笔记07_IREP通过页面测试客户化Web Service调用(案例)
20150819 Created By BaoXinjian
- AP_HZ Party和Supplier、Bank表关系详解
2014-06-26 Created By BaoXinjian
- MST_kruskal
kruskal是求最小生成树的算法. 首先,kruskal就是把所有边按照权值从小到大的顺序排列,这一步可以直接使用sort,然后依次考查每一条边,设w=(u,v)表示从u到v的一条边的权值为w,则有 ...
- Web Penetration Testing 渗透 通信信息安全
参考 http://download.csdn.net/detail/jason571/8146587 一.操作系统原理,JavaScript,http/https的运行原理,Ajax,SQL等技术基 ...
- spring外部化配置
例如 <bean id="dataSource" class="....." p:username="aa" p:password=& ...
- ipython and bpython
ipython: 1.安装easy_install工具 wget http://peak.telecommunity.com/dist/ez_setup.py python ez_setup.py 2 ...
- maven项目导入eclipse
maven项目的配置文件 web java文件都在src下面 src/main/java src/main/webapp src/main/webapp/web-inf 导入后要重新添加jar包,设置 ...
- Java中的JDBC基础
简介 JAVA程序想要对数据库进行访问,需要有JDBC驱动程序的支持.JDBC驱动程序提供了对各种主流数据库的接口,程序员只需要学习掌握这一套接口,就可以实现对所有数据库的访问代码编写. 一般步骤 J ...
- [SQL]patindex的用法
返回指定表达式中某模式第一次出现的起始位置:如果在全部有效的文本和字符数据类型中没有找到该模式,则返回零. Transact-SQL 语法约定 语法 PATINDEX ( '%pattern%' , ...
- String Format for DateTime
This example shows how to format DateTime using String.Format method. All formatting can be done als ...