因为霍夫曼编码以bit为单位，长度又不确定，读取时无法区分，JPEG采用了范式霍夫曼编码。

读取并生成霍夫曼表

JPEG中DC系数和AC系数是分别进行编码将霍夫曼表保存在DQT中。

直接上代码解释可能更直接：

let mut code = 0usize;

let mut length = [0; 16];

for i in 0..16 {

    length[i] = data[offset + i + 1];

    for j in 0..length[i] as usize {

        if code >= (1 << (i + 2)) {

            return Err(HuffmanErrorType::InvalidCode(data[off + j], code));

        }

        map.insert(Binary::new(code, i + 1), data[off + j]);

        code += 1;

    }

    off += length[i] as usize;

    code <<= 1;

}

首先定义了一个变量code，用于计算对应的编码，根据范式霍夫曼编码的计算方法从0开始。因为霍夫曼编码的长度最大为16bit，所以用了长16字节的数组，保存了不同长度的编码个数

let mut code = 0usize;

let mut length = [0; 16];

然后依次读取不同长度的编码个数

for i in 0..16 {

    length[i] = data[offset + i + 1];

    ...

}

然后根据编码长度进行循环计算，相同长度的编码每计算出一个就将code+1。这里为了后面解码方便直接用map保存键值对。

Binary是一个保存了值和二进制长度的结构体，用于区分不同长度的二进制串

for j in 0..length[i] as usize {

    // 错误处理部分省略

    map.insert(Binary::new(code, i + 1), data[off + j]);

    code += 1;

}

然后在编码长度+1时将code左移一位

code <<= 1;

霍夫曼解码

选择霍夫曼表

霍夫曼表数量=颜色分量数*2，比如RGB和YCbCr都是3个颜色分量，而灰度则是1个颜色分量，颜色分量数以及每一个颜色分量的DC、AC系数解码所需的霍夫曼表编号都保存在SOF中。

选择出需要的DC、AC系数的霍夫曼表后，就可以开始解码了

解码

JPEG中将图像按8x8大小进行分块，所以都是以64个数为一组进行解码的，其中第一个数是DC系数，其余的63个则是AC系数

DC系数

DC系数需要首先读取一个经过霍夫曼编码的数据，这个数表示需要读取的bit长度。再以这一长度读取一个二进制串（未经过霍夫曼编码），如果长度为0则表示这里的数据就是0。

这一个二进制串的最高位是符号位，为1表示正数，为0表示负数，如果只有1位那就是只有符号位。然后要对符号位之外表示的数按位取反，按符号位得出正负得到DPCM编码。

DPCM编码实际上也很简单，就是加上上一个DC系数就好了（如果是第一个DC系数则不用加或者加0）

代码如下：

let codeval = dc.huff.decode(bs)?;

let len = codeval as usize;

if len == 0 {

    code[0] = last_dc;

} else if len == 1 {

    code[0] = last_dc + bs.read(len)? as isize * 2 - 1; // 0 -> -1, 1 -> 1

} else {

    let sign = bs.read(1)?;

    let num = sign << (len - 1) | bs.read(len - 1)?;

    let result;

    if sign == 0 {

        result = -(((!num) & ((1 << len) - 1)) as isize); // Rust中按位取反是!有点不适应

    } else {

        result = num as isize;

    }

    code[0] = result + last_dc;

}

AC系数

先用霍夫曼解码出一个数，这个数的高4位表示0的个数，而低4位后面的数据的bit长度。其中有两种特殊情况：全为0则是EOB(End Of Block)，直接结束AC系数解码，剩余的部分用0填充；高4位为1，低4为0则表示有连续16个0.

后面读取出的数据和DC系数解码的方式一样，先是1位符号位，后面跟着剩余位的数据。

代码如下：

let mut i = 1;

while i < 64 {

    let codeval = ac.huff.decode(bs)?;

    let zero = codeval >> 4;

    let len = (codeval & 0x0f) as usize;

    if len == 0 {

        if codeval == 0xf0 { // 连续16个0

            i += 16;

            continue;

        } else { // End Of Block，直接结束

            break;

        }

    } else if len == 1 {

        i += zero as usize;

        code[i] = bs.read(len)? as isize * 2 - 1; // 0 -> -1, 1 -> 1

    } else {

        let sign = bs.read(1)?;

        let num = sign << (len - 1) | bs.read(len - 1)?;

        let result;

        if sign == 0 {

            result = -(((!num) & ((1 << len) - 1)) as isize);

        } else {

            result = num as isize;

        }

        i += zero as usize;

        code[i] = result;

    }

    i += 1;

}

参考资料

博客园博客：JPEG解码——(4)霍夫曼解码 - OnlyTime_唯有时光 - 博客园 (cnblogs.com)

JPEG标准：Microsoft Word - T081E.DOC (w3.org)

一个Rust写的JPEG解码器：MROS/jpeg_tutorial: 跟我寫 JPEG 解碼器 (Write a JPEG decoder with me) (github.com)

友情链接

我学习过程中写的JPEG图片查看器：Ryan1202/my-tiny-jpeg-viewer: A Tiny Jpeg Viewer (github.com)

JPEG格式研究——（3）霍夫曼解码的更多相关文章

JPEG解码——(4)霍夫曼解码
本篇是该系列的第四篇,主要介绍霍夫曼解码相关内容. 承接上篇,文件头解析完毕后,就进入了编码数据区域,即SOS的tag后的区域,也是图片数据量的大头所在. 1. 解码过程规则描述 a)从此颜色分量单元 ...
C# 霍夫曼二叉树压缩算法实现
知道有的人比较懒,直接贴全部代码. 一开始一次性Code完了压缩部分代码.只调试了2,3次就成功了. 一次性写150行代码,没遇到什么bug的感觉还是蛮爽的. 写解压代码,才发现压缩代码有些细节问题. ...
基于python的二元霍夫曼编码译码详细设计
一.设计题目对一幅BMP格式的灰度图像(个人证件照片)进行二元霍夫曼编码和译码二.算法设计 (1)二元霍夫曼编码: ①:图像灰度处理: 利用python的PIL自带的灰度图像转换函数,首先将彩色图 ...
霍夫曼编码（Huffman Coding）
霍夫曼编码(Huffman Coding)是一种编码方法,霍夫曼编码是可变字长编码(VLC)的一种. 霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符 ...
c++实现哈夫曼树，哈夫曼编码，哈夫曼解码（字符串去重，并统计频率）
#include <iostream> #include <iomanip> #include <string> #include <cstdlib> ...
Java数据结构（十二）—— 霍夫曼树及霍夫曼编码
霍夫曼树基本介绍和创建基本介绍又称哈夫曼树,赫夫曼树给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树霍夫曼树是带权路径长度最短的树,权值较 ...
赫夫曼\哈夫曼\霍夫曼编码 (Huffman Tree)
哈夫曼树给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离 ...
word2vec 中的数学原理二预备知识霍夫曼树
主要参考: word2vec 中的数学原理详解自己动手写 word2vec 编码的话,根是不记录在编码中的这一篇主要讲的就是霍夫曼树(最优二叉树)和编码. ...
CF 463A && 463B 贪心 && 463C 霍夫曼树 && 463D 树形dp && 463E 线段树
http://codeforces.com/contest/462 A:Appleman and Easy Task 要求是否全部的字符都挨着偶数个'o' #include <cstdio> ...
采用霍夫曼编码(Huffman)画出字符串各字符编码的过程并求出各字符编码 --多媒体技术与应用
题目:有一个字符串:cabcedeacacdeddaaaba,问题: (1)采用霍夫曼编码画出编码的过程,并写出各字符的编码 (2)根据求得的编码,求得各编码需要的总位数 (3)求出整个字符串总编码长 ...

随机推荐

坑人的opencv安装
我想捡起来C++,最近在看opencv,于是我想着一起吧. 但是我低估了这个小麻烦的魅力,曾经安装opencv c++版本就头秃,如今依然头秃.说明我没长进啊-- 折腾了两天,终于装上了. 其中最麻烦 ...
【效果】使用canvas rotate实现一个旋转的矩形
使用canvas rotate实现一个旋转的矩形,并且以矩形的中心为原点,围绕原点旋转: <canvas id="canvas" width="800" ...
CSS – Sass & SCSS
前言 CSS 代码多了就不好管理了, 这是它语法先天的不足. Sass 就是加强它语法的, Sass 为 CSS 引入了一些 JS 语言的特性, 比如 variable, function, para ...
Asp.net core 学习笔记 dotnet & azure 常用 command
更新: 2021-08-26 最近试了一下 vs 2022 结果 .net cli 也自动升级到 .net 6 preview 版本, 害我 dotnet new 的时候出来一个 .net 6 tem ...
Mininet安装记录
安装环境: Ubuntu虚拟机版本:14.04 Mininet版本:2.3.1b1 1.更改软件镜像源在设置中进行如下操作: 选择国内的镜像站点,如阿里云. 点击关闭后,在弹出的窗口中点击重新载入, ...
vscode废掉了，跳转不到函数定义，无法自动补全，重装也没用的解决办法
1. 先卸载掉所有已安装的插件 2. 卸载vscode 3. 删除个人配置和插件配置,涉及两个文件夹 4. 需要安装C/C++组件,下载对应的vsix文件下载地址: https://github.c ...
使用 fabric.js 开发移动端 H5 图片编辑器
大家好,我是开源图片编辑器的 https://github.com/ikuaitu/vue-fabric-editor 的作者,它是一款基于 PC 版本的开源图片编辑器. 最近很多开发者咨询,是否可以 ...
Linux调度器：进程优先级
一.前言本文主要描述的是进程优先级这个概念.从用户空间来看,进程优先级就是nice value和scheduling priority,对应到内核,有静态优先级.realtime优先级.归一化优先级 ...
2024年7月中国数据库排行榜：PolarDB独领云风骚，达梦跨越新巅峰
在7月发布的中国数据库流行度排行榜中,各大国产数据库厂商在不同领域表现势如破竹,PolarDB以800分刷新记录,并在SIGMOD 2024上获得"最佳论文奖":OceanBase ...
2022年6月中国数据库排行榜：TiDB卷土重来摘桂冠，达梦蛰伏五月夺探花
排行榜风云又起,各产品墨坛论剑.2022年6月的中国数据库流行度排行榜再掀风云,6月排行榜共有231个数据库参与排名,两名新成员的加入,注入了新活力.本月排行榜用一句话可以概括为:TiDB卷土重来 ...

JPEG格式研究——（3）霍夫曼解码