【原创】JPEG图像密写研究（三）数据流译码

【原创】这次更新比较慢，译码过程比想象中复杂一些，更主要是译出来的DCT系数无法确定是否正确，要想验证就需要再进行正向压缩编码，再次形成jpeg图像验证正确，后续工作正在开展，这里就说一说译码的主要思路和过程。

说到译码过程，首先要了解jpeg图像数据流的组成：

数据流是以MCU（最小编码单元）为基本单位的，一个MCU又由若干个Y，Cr，Cb颜色分量单元组成，这里的颜色分量单元可以看作是一个8*8的矩阵，也就是译码过程中的最小单元了，可能读者对于这些结构的关系还不是很了解，OK，我们来看看下面这个图（word绘制，简洁易懂~）

一个MCU中的颜色分量单元个数由jpeg文件头中SOF0段中定义，SOF0段中有定义每个颜色分量的水平和垂直采样因子，这里假设水平，垂直采样因子分别为2:1:1,2:1:1。这个采样因子是什么意思呢，我们来看看上图。假设上图是一个16*16（像素）的图片，可以分成四个8*8的小矩阵，每个8*8小矩阵都是一个颜色分量单元，Y分量的水平采样因子为2则说明在一个MCU的水平方向上采样两次，垂直采样因子同理，因此在本例中一个MCU会有4个Y颜色分量单元，1个Cr颜色分量单元，1个Cb颜色分量单元。从这里我们也能得知一个MCU的大小是由水平、垂直采样因子的最大值决定的，假设分别为V_max和H_max，则MCU的大小为（V_max*8）*（H_max*8）。这些结构的关系如下：

颜色分量单元组成MCU，MCU组成数据流

现在再来看看图片中含有多个MCU的情况，假设有四个，允许我再盗用一下上面的图哈，

可以看到，一幅图像里MCU是按行排列的，在数据流中保存的顺序就是MCU1、MCU2、MCU3、MCU4。。。。每个MCU中的顺序为Y1、Y2、Y3、Y4、Cr、Cb（这里是按采样因子4:1:1，其他也类似，总之就是按Y、Cr、Cb的顺序）。

了解了数据流的组成，下面就要开始译码工作了，这也是个烦杂的过程。。。。

在JPEG压缩过程中，不仅使用了哈夫曼编码，还使用了RLE行程编码和差分编码，真是极尽压缩啊。。。这三种编码在JPEG中是综合运用的，可以达到很好的压缩效果。本人这里就从解码的角度来进行介绍了，个人觉得从解码角度来理解更为方便~

首先，JPEG中直流和交流系数是分开进行编码的，也就是说译码的过程有些许不同，而且采用的哈夫曼树也是不同的，其次，JPEG中的每个颜色分量也是分开进行编码的，不同颜色分量采用的哈夫曼树也是不同的，具体的每个颜色分量的交直流系数采用的哈夫曼树ID可以从文件头的SOF0段中得知，SOF0段的内容可以看我的另一篇博文

http://www.cnblogs.com/gungnir2011/p/3615273.html

在数据流中是以bit为单位存储信息的，每个DCT系数（8*8）矩阵都有1个直流分量和63个交流分量，每个矩阵的译码都先译直流分量，再译交流分量，具体的步骤如下：

1.按bit读取，对直流哈夫曼树进行搜索，直到搜索到叶子节点，说明这时命中了一个编码，哈夫曼树的权值代表还需继续读取多少bit，比如权值为0x04，则说明继续读取4bit，这4bit的值根据译码表（后面会给出）获取的值就是直流DCT系数。

2.继续按bit读取，这时是对交流哈夫曼树进行搜索，直到叶子节点，这里的权值和直流不一样，权值的高四位代表即将译出的交流DCT系数前面有多少个0，这里是行程编码，低四位代表还需继续读取多少bit，之后获得系数和直流一样。

3.不断重复步骤2，直到满足结束条件：

读到的权值为0，则该矩阵中之后的所有值都为0，并结束该矩阵的译码；
63个交流分量都已全部译完。

译码表：

编码数值	实际数值
0,1	-1,1
00,01,10,11	-3，-2,2,3
000,001,010,011,100,101,110,111	-7，-6，-5，-4，4,5,6,7
.................	......................

之后就是译完一个矩阵译下一个，译完一个颜色分量译下一个，直到所有译完~~

当然这只是理论，在实践过程中会遇到各种奇葩问题，下次更新中会详细说说我遇到的各种奇葩错误，现在还未完全写完译码部分，为了进度现在直接在研究libjpeg开源库，之后可能会找个时间把译码做完，未完待续~~

---------------------------------------------------分割线-------------------------------------------------------------

现在来说说我遇到的各种奇葩问题：

首先，关于权值问题，刚开始译码的时候没有考虑到交流权值的低四位和直流权值为0的情况，运行自然就挂掉了。。。遇到这种情况，就说明继续读取0bit，0bit的值就是0，所以遇到这种情况得到的系数值就应该是0。

其次，有些8*8的矩阵译码有时候会出现译出第65个值，按道理来说应该只有64个值的，这种情况我还没有弄清楚是什么原因，但是在没有出现这种情况以前译码的结果都是对的，当出现这种情况以后大概再过几个矩阵之后所有的译码结果基本上都不对。。。具体原因我会继续分析，因此在这里再次推荐使用库函数进行操作。

再来说说一些注意事项和建议吧：

记录当前读取到第几个字节的第几位时，记录位数一定要计算好，一位出错，之后全错。。。像一些系数译出来要退出，以及其他退出情况时，退出之前要将位数往后移；
对于继续读取的位数为0的情况最好单独进行处理，逻辑也容易清晰一些；
读取出来的二进制要根据上述译码表进行译码，不能直接转换，否则结果不对；

其他就是一些编程时需要注意的小问题了，就不一一叙说了。

【原创】JPEG图像密写研究（三）数据流译码的更多相关文章

【原创】JPEG图像密写研究（二）哈夫曼树的建立
[原创]记录自己研究的过程,仅供参考,欢迎讨论... 在根据JPEG图像文件结构读取完文件后,提取出其中DHT段,利用其中内容建立哈夫曼树,便于之后译码工作.这里需要注意的是文件中的哈夫曼表数量不固定 ...
JPEG图像密写研究（一） JPEG图像文件结构
[转载]转载自http://www.cnblogs.com/leaven/archive/2010/04/06/1705846.html JPEG压缩编码算法的主要计算步骤如下: (0) 8*8分块. ...
JPEG图像压缩算法流程详解
JPEG图像压缩算法流程详解 JPEG代表Joint Photographic Experts Group(联合图像专家小组).此团队创立于1986年,1992年发布了JPEG的标准而在1994年获得 ...
怎么用ABBYY将PDF转换为JPEG图像
FineReader Mac版,全称ABBYY FineReader Pro for Mac,是一款流行的OCR图文识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索 ...
CUDA 实现JPEG图像解码为RGB数据
了解JPEG数据格式的人应该easy想到.其对图像以8*8像素块大小进行切割压缩的方法非常好用并行处理的思想来实现.而其实英伟达的CUDA自v5.5開始也提供了JPEG编解码的演示样例.该演示样例存储 ...
多媒体（4）：JPEG图像压缩编码
(重要的事放前面)此JPEG的C++实现见 https://github.com/chencjGene/SoftEngineering/tree/master/JPEG 目录多媒体(1):MCI接口 ...
opencv IplImage各参数详细介绍以及如何从一个JPEG图像数据指针转换得到IplImage
这篇文章里介绍得最清楚了.http://blog.chinaunix.net/uid-22682903-id-1771421.html 关于颜色空间 RGB颜色空间已经非常熟悉了.HSV颜色空间需要 ...
假设高度已知，请写出三栏布局，其中左栏、右栏各为300px，中间自适应的五种方法
假设高度已知,请写出三栏布局,其中左栏.右栏各为300px,中间自适应的五种方法 HTML CSS 页面布局题目:假设高度已知,请写出三栏布局,其中左栏.右栏各为300px,中间自适应 <!D ...
python 在图像上写中文字体 (python write Chinese in image)
本人处理图像的时候经常使用opencv的包,但是 cv2.putText 显示不了中文,所以查找了如何在python在图像上写中文的方法,在伟大的Stack Overflow上面找到一个方法,分享给大 ...

随机推荐

HTTP协议探析
1.HTTP协议概述超文本传输协议(HTTP)是一种为分布式,协作式的,超媒体信息系统.它是一种通用的,无状态(stateless)的协议,除了应用于超文本传输外,它也可以应用于诸如名称服务器和分布 ...
bat文件自动编译InnoSetup脚本
今天想制作一个bat文件,打包多个innosetup脚本,参考链接:http://www.cnblogs.com/joean/p/4870428.html 流程: 新建文本文档,将.txt改为.bat ...
显示GetLastError()的错误描述字符串
void ShowLastError() { LPVOID lpMsgBuf; FormatMessage ( FORMAT_MESSAGE_ALLOCATE_BUFFER | //返回一个已分配的内 ...
poj 2771 最大独立集
这道题又无耻的抄袭了别人的代码. 刚开始以为是最大匹配,把条件不相符的人连一起,然后求最大匹配,感觉麻烦,然后看了别人的解题报告,是把相符的人连一起,然后减去,其实就是最大独立集. 最大独立集=|G| ...
在VS工程中，添加c/c++工程中外部头文件及库
在VS工程中,添加c/c++工程中外部头文件及库的基本步骤: 1.添加工程的头文件目录:工程---属性---配置属性---c/c++---常规---附加包含目录:加上头文件存放目录. 2.添加文件引用 ...
Android studio 查看sha1
高德地图开发申请KEY的时候需要开发者提供SHA1证书指纹数据,在eclipse很容易就找到了,但是Android Studio很久也没找到,只能使用在网上看到的方法了,在Android Studio ...
转 ——eclipse下进行Python开发环境配置
python for eclipse插件安装1.下载python for eclipsepython for eclipse下载地址,如:org.python.pydev.feature-1.6.3. ...
FLAG_ACTIVITY_NEW_TASK和SingleInstance的设计思路（多task的应用）
这部分的想法都是基于以下两点: 1.Activity可能被复用,可能是复用Activity的功能,还可能是复用Activity的状态: 2.Task的作用:target,同一个task中的Activi ...
SQL Server Primary key 、clustered index 、 unique
primary key: 1.主键不可以有空值. 2.不可以有重复行. unique : 1.可以有空行. 2.不可以有重复行. clustered index: 1.可以有重复行. 2.可以有空行. ...
微软 Office 2010 SP2 正式版下载大全（含简中）
7月24日消息,微软正式为 Office 2010 和 SharePoint 2010 系列产品发布 SP 2服务包,带来重要更新和修复.除了提供产品补丁,SP2服务包还将提升产品的稳定性.性能以及安 ...

【原创】JPEG图像密写研究（三） 数据流译码

【原创】JPEG图像密写研究（三） 数据流译码的更多相关文章

随机推荐

热门专题

【原创】JPEG图像密写研究（三）数据流译码

【原创】JPEG图像密写研究（三）数据流译码的更多相关文章