zlib 压缩输出缓冲区 overflow 问题

问题
分析
解决
参考

问题

后台服务传包太大时，我们框架可以使用 zlib 库对响应进行压缩；在这次服务调试过程中，使用 zlib compress2 以 Z_BEST_COMPRESSION 模式进行压缩时，报 Z_BUF_ERROR(-5) 错误

分析

bool Codec::ZlibCompress(const std::string& src , std::string& compr_str)

{

    int max_size = src.size();

    if(max_size == 0)

    {

        return false;

    }

    DataBuffer<char> compr(max_size);

    memset(compr, 0, max_size);

    uLongf compr_len = max_size;

    int res = compress2((Bytef*)compr.Get(),&compr_len,(const Bytef*)(src.c_str()),src.size(),9);

    if(res != Z_OK)

    {

        return false;

    }

    compr_str = Base64Encode((const void*)compr,compr_len);

    return true;

}

这里 compress2 的输出缓冲区大小设置成为待压缩原串的长度了，在压缩数据太小或随机性很大等情况下，压缩得到的数据可能会比原来的大，导致 Z_BUF_ERROR；

下面的数据是对随机字符的压缩情况，src_size 为原串大小，compr size 为压缩后长度，说明在字符很随机的情况下，压缩完再使用 Base64Encode（Base64 编码数据会增大 1/3），长度一般都会变大。

解决

int compressBound(uLong sourceLen);

zlib 提供了一个 compressBound 方法，用于估算调用一次 compress2()/compress()，用于压缩 sourceLen 长度数据所需输出缓冲区的最大大小。

但是框架压缩后，对压缩串进行 Base64 编码（Base64 编码数据会增大 1/3），最终的输出缓冲区大小应该至少设置为 compressBound(sourceLen) * 4 / 3，因此改后的代码为：

bool Codec::ZlibCompress(const std::string& src , std::string& compr_str)

{

    int src_size = src.size();

    // 原串则不进行压缩，且压缩输出串置空

    if(0 == src_size)

    {

        compr_str = "";

        return true;

    }

    /*

        经过测试，在 best_compress(9) 的模式下，由随机字符构成的原串，压缩输出串有可能比原串长度大

        由随机字符构成的原串，长度在 0-40k 情况下，output_buffer_size / compressBound() * 100 最大为 133.33（best_compress 和 best_speed 下此值一样）

        为保证输出缓冲区足够大，缓冲区大小设置为 compressBound() * 2

    */

    int max_size = compressBound(src_size) * 2;

    // 如果得到的输出缓冲区大小不大于 0，则返回压缩失败

    if(max_size <= 0)

    {

        return false;

    }

    DataBuffer<char> compr(max_size);

    uLongf compr_len = max_size;

    int res = compress2((Bytef*)compr.Get(),&compr_len,(const Bytef*)(src.c_str()),src_size,9);

    if(res != Z_OK)

    {

        return false;

    }

    compr_str = Base64Encode((const void*)compr,compr_len);

    return true;

}

bool Codec::ZlibDecompress(const std::string& base64_src , std::string& decmpr_str)

{

    int size = base64_src.size();

    if(0 == size)

    {

        decmpr_str = "";

        return true;

    }

    DataBuffer<char> src(base64_src.size());

    int base64_res = Base64Decode((const char*)(base64_src.c_str()),base64_src.size(),(void*)src,&size);

    if(base64_res != 0)

    {

        return false;

    }

    int max_size = size*30;

    DataBuffer<char> decompr(max_size);

    uLongf decompr_len = max_size;

    uLong src_size = size;

    int res = uncompress2((Bytef*)decompr.Get(),&decompr_len,(const Bytef*)src.Get(),&src_size);

    if(res != Z_OK)

    {

        return false;

    }

    decmpr_str = std::string(decompr , decompr_len);

    return true;

}

参考

compressBound

http://refspecs.linuxbase.org/LSB_3.0.0/LSB-PDA/LSB-PDA/zlib-compressbound-1.html

In what situation would compressed data be larger than input?

https://stackoverflow.com/questions/16992754/in-what-situation-would-compressed-data-be-larger-than-input

zlib详细基础教程

https://www.0xaa55.com/thread-442-1-1.html

zlib 压缩输出缓冲区 overflow 问题的更多相关文章

PHP基础之输出缓冲区基本概念、原理分析
一.概念在PHP运行的过程中,可以将会产生输出的函数或操作结果暂时保存在PHP的缓冲区,只有当缓冲区满了.或者PHP运行完毕.或者在必要时候进行输出,才会将数据输出到浏览器,此缓冲数据的区域称为PH ...
深入理解php的输出缓冲区(output buffer)
这篇文章是翻译自Julien Pauli的博客文章PHP output buffer in deep,Julien是PHP源码的资深开发和维护人员.这篇文章从多个方面讲解了PHP中的输出缓冲区以及怎么 ...
PHP中zlib扩展实现GZIP压缩输出各种方法总结
一般情况下我们出现大量数据传输理希望减少服务器的带宽压力,会采取一种方式来压缩文件传输,php中用zlib也可以实现gzip压缩输出,下面我们来看GZIP压缩输出各种方法总结. GZIP(GNU-ZI ...
饼干是这样压缩的——PHP使用zlib扩展实现页面GZIP压缩输出
饼干是这样压缩的——PHP使用zlib扩展实现页面GZIP压缩输出 GZIP(GNU-ZIP)是一种压缩技术.经过GZIP压缩后页面大小可以变为原来的30%甚至更小.这样用户浏览的时候就会感觉很爽很愉 ...
PHP的输出缓冲区（转）
什么是缓冲区?简单而言,缓冲区的作用就是,把输入或者输出的内容先放进内存,而不显示或者读取.至于为什么要有缓冲区,这是一个很广泛的问题,如果有兴趣,可以在网山找下资料.其实缓冲区最本质的作用就是,协调 ...
PHP的输出缓冲区
什么是缓冲区?简单而言,缓冲区的作用就是,把输入或者输出的内容先放进内存,而不显示或者读取.至于为什么要有缓冲区,这是一个很广泛的问题,如果有兴趣,可以在网山找下资料.其实缓冲区最本质的作用就是,协调 ...
zlib打印bit length overflow
bit length overflow code bits -> code bits -> zlib库输出此log,此log不代表压缩出现错误,没有什么危害,而且zlib非常稳定,完全可以 ...
Nginx_地址重写(rewrite)_日志管理(log_format)_压缩输出_Nginx设定限速_Nginx设置反向代理及反向代理缓存
Nginx地址重写 Nginx rewrite rewrite语法规则1).变量名可以使用 "=" 或 "!=" 运算符~ 区分大小写~* 不区分大小写^~ 禁 ...
Delphi Base64编码/解码及ZLib压缩/解压
最近在写的程序与SOAP相关,所以用到了一些Base64编码/解码及数据压缩/解压方面的知识. 在这里来作一些总结: 一.Base64编码/解码一般用到的是Delphi自带的单元EncdDe ...

随机推荐

Shell入门之概念
1.一切皆是文件: 在bash Shell 中一切皆是文件,不管是我们认为的文本文件,还是那些文件夹的东西,在这里都是文件,Linux只管比特和字节流,而不关心他们最终组成了什么格式,这些工作交给在L ...
VC和GCC静态变量析构顺序不同
VC和GCC静态变量析构顺序不同(金庆的专栏)静态变量析构顺序正常情况下是构造的反序.但是VC对DLL中的静态变量好像是需等待DLL卸载时再析构,表现为主程序中的静态变量先析构,DLL中的静态变量后析 ...
SpringMVC注解控制器详解
主要包括四类:@Component.@Repository @Service.@Controller 说明: @Controller 控制层,就是我们的action层 @Service 业务逻辑层,就 ...
(NO.00001)iOS游戏SpeedBoy Lite成形记(二十二)
自己的游戏自己更需要多玩,这样才能首先发现不足的地方.所以本猫到现在已经忍一个地方很久了,就是弹出moneyLayer后每次都要输入数字才能关闭,这多少让人不爽.于是本篇我们就修正这个小小的不便. 首 ...
C++大小写转换和性能
p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-bottom: .0001pt; text-align: justify; f ...
UTF-8是现在流行的编码方式，根据规定回答问题
UTF-8是现在流行的编码方式,下面是RFC2279对UTF-8编码规则的规定 UCS-4 range (hex.) UTF-8 octet sequence (binary) 0000 0000-0 ...
重新初始化VS2010
开始->所有程序->Microsoft Visual Studio 2010->Visual Studio Tools->Visual Stdio命令提示(2010) 这时会 ...
【Android 应用开发】OpenGL ES 2.0 -- 制作 3D 彩色旋转三角形 - 顶点着色器片元着色器使用详解
最近开始关注OpenGL ES 2.0 这是真正意义上的理解的第一个3D程序 , 从零开始学习 . 案例下载地址 : http://download.csdn.net/detail/han120201 ...
LeetCode之“散列表”：Valid Sudoku
题目链接题目要求: Determine if a Sudoku is valid, according to: Sudoku Puzzles - The Rules. The Sudoku boar ...
安卓笔记--Edittext禁止换行
直接在EditText的xml文件中通过配置android:singleLine="true"把虚拟键盘上的enter键禁止掉,不会显示 <edittext android: ...

zlib 压缩输出缓冲区 overflow 问题

问题

分析

解决

参考

zlib 压缩输出缓冲区 overflow 问题的更多相关文章

随机推荐

热门专题