哈夫曼编码/ 译码系统(树应用)

[问题描述]

任意给定一个仅由 26 个大写英文字母组成的字符序列,根据哈夫曼编码算法,求得每个字符的哈夫曼编码。

要求:

1)输入一个由 26 个英文字母组成的字符串,请给出经过哈夫曼编码后的编码序列及其编码程度。(编码)

2)采用上一问题的哈夫曼编码,给定一串编码后的序列,将其翻译为原字符序列。(解码)

样例:

输入原串:CASBCATBSATBAT

输出:

A 00

B 10

T 11

C 010

S 011

输入:0100011

输出:CAT

设计思路

自顶向下拆解:

  1. 编码部分(Encode)

    a)  输入字符串;

    b)  根据输入的字符串创建HuffmanTree;

    c)  遍历HuffmanTree 得到各结点的HuffmanCode;

    d)  收集各个叶节点的字符及其HuffmanCode,做成HuffmanCodeTable并输出。

     :由HuffmanTree的构造方法可知:叶节点 <=> “有效字符”

  2. 译码部分(Decode)

    a)  输入密文字符串;

    b)  在HuffmanCodeTable中逐字匹配以找到明文字符 / 或是直接遍历HuffmanTree即可;

    c)  输出明文字符串。

思维导图如下:

代码实现

两个类:

 1 class HuffmanTNode  // 用于Encode时的HuffmanTree
2 {
3 public:
4 char ch; // 字符
5 int weight; // 权值、频次
6 HuffmanTNode* lchild;
7 HuffmanTNode* rchild;
8 string HuffmanCode;
9
10 HuffmanTNode() : HuffmanCode(), lchild(nullptr), rchild(nullptr) {}
11 HuffmanTNode(char a, int wei) : ch(a), weight(wei), HuffmanCode(), lchild(nullptr), rchild(nullptr) {}
12 HuffmanTNode(const HuffmanTNode &other) : ch(other.ch), weight(other.weight), HuffmanCode(other.HuffmanCode),
13 lchild(other.lchild), rchild(other.rchild) {}
14 ~HuffmanTNode() {
15 // 对左右子树的递归清理
16 if (lchild != nullptr) {
17 delete lchild;
18 }
19 lchild = nullptr;
20 if (rchild != nullptr) {
21 delete rchild;
22 }
23 rchild = nullptr;
24 }
25 };
26
27 class HuffmanCharAndCode // 用于Decode时的查找表
28 {
29 public:
30 char ch; // 字符
31 string HuffmanCode; // 哈夫曼编码
32
33 HuffmanCharAndCode() {}
34 HuffmanCharAndCode(char a, const string &code) : ch(a){
35 HuffmanCode += code;
36 }
37 ~HuffmanCharAndCode() {}
38 };

包装类 * 2

Encode:

  1. main() 函数展示了程序的主干,如下:

 1 int main() {
2
3 /*************************ENCODE*************************/
4 // 1 输入字符串
5 printf("ENCODE: \n");
6 string str;
7 printf("plz Enter String :");
8 std::cin >> str;
9
10 // 2 根据输入的字符串创建HuffmanTree
11 HuffmanTNode* root = CreateHuffmanTree(str);
12 while (root == nullptr) { // 非法输入字符串的处理
13 printf("\nERROR! Invalid Input!\n");
14 printf("plz Enter String Again :");
15 std::cin >> str;
16 root = CreateHuffmanTree(str);
17 }
18
19 // 3 根据生成的HuffmanTree得到HuffmanCodeTable
20 vector<char> vec_code;
21 GetHuffmanCode(root, vec_code);
22 vector<HuffmanCharAndCode*> HuffmanCodeTable;
23 GetHuffmanCodeTable(root, HuffmanCodeTable);
24
25 // 4 输出字符及其对应的HuffmanCode
26 printf("\nSUCCESS! the HuffmanCode is listed as below: \n");
27 std::sort(HuffmanCodeTable.begin(), HuffmanCodeTable.end(), compare_CodeTable);
28 OutputHuffmanCode(HuffmanCodeTable);
29
30 /*************************DECODE*************************/
31
32 // 1 输入密文字符串
33 printf("\nDECODE: \n");
34 string ciphertext;
35 printf("plz Enter CipherText :");
36 std::cin >> ciphertext;
37
38 // 2 解码密文字符串得到明文
39 string cleartext;
40 int error_index = 1;
41 while (HuffmanDecode(ciphertext, HuffmanCodeTable, cleartext, error_index) == false) { // 非法密文字符串的处理
42 printf("\nERROR! Invalid Input Ciphertext!\n");
43 printf("\nthe POTENTIAL index of error char in at: %d\n", error_index);
44 printf("plz Enter CipherText Again :");
45 std::cin >> ciphertext;
46 }
47
48 // 3 输出明文字符串
49 printf("SUCCESS! the ClearText is: \n");
50 std::cout << cleartext << std::endl;
51
52 // 释放HuffmanTable
53 for (HuffmanCharAndCode* elem : HuffmanCodeTable) {
54 delete elem;
55 }
56
57 system("pause");
58 return 0;
59 }

main()

  2. 创建HuffmanTree(),如下:

 1 HuffmanTNode* CreateHuffmanTree(const string &str) {
2 // 字符串检查
3 if (str.size() == 0) { return nullptr; }
4 // 字符频次记录桶
5 vector<HuffmanTNode*> bucket;
6 // 填充字符频次记录桶
7 if (FillCharFrequencyBucket(str, bucket) == false) { return nullptr; }
8 // 若只有一个字符 那么没必要用哈夫曼编码
9 if (bucket.size() == 1) { return nullptr; }
10
11
12 // 当bucket中只剩下一个元素,那么它就是HuffmanTree的root
13 while (bucket.size() != 1) {
14 // 令bucket中元素按weight非递增排序
15 std::sort(bucket.begin(), bucket.end(), compare_bucket);
16
17 // 从bucket中取两个最小的elem
18 HuffmanTNode *elem_1 = bucket[bucket.size() - 1]; bucket.pop_back();
19 HuffmanTNode *elem_2 = bucket[bucket.size() - 1]; bucket.pop_back();
20 // 根据 elem1 与 elem2 的weight 得到它俩的 root
21 HuffmanTNode *root_tmp = new HuffmanTNode('\0', elem_1->weight + elem_2->weight);
22 // root_tmp, elem_1, elem_2 三者组成三结点的二叉树
23 root_tmp->lchild = elem_2;
24 root_tmp->rchild = elem_1;
25
26 // root_tmp 入桶
27 bucket.push_back(root_tmp);
28 }
29
30 // bucket中最后元素,就是哈夫曼树的根节点指针
31 HuffmanTNode *root = bucket[0];
32 return root;
33 }

CreateHuffmanTree()

  3. 遍历得到各结点HuffmanCode,再收集各个叶节点的Code即可,我就只放前者吧,稍微有趣一点,如下:

 1 // 将vec_code中的字符转为字符串 并赋给当前节点curr->HuffmanCode
2 void visit(HuffmanTNode *curr, const vector<char> &vec_code) {
3 string Code(vec_code.begin(), vec_code.end());
4 curr->HuffmanCode = Code;
5 }
6
7 // (前序遍历改) 得到HuffmanTree上每个结点的HuffmanCode
8 void GetHuffmanCode(HuffmanTNode *root, vector<char> vec_code) {
9 if (root != nullptr) {
10 visit(root, vec_code);
11 vec_code.push_back('0');
12 GetHuffmanCode(root->lchild, vec_code);
13 vec_code.pop_back();
14 vec_code.push_back('1');
15 GetHuffmanCode(root->rchild, vec_code);
16 vec_code.pop_back();
17 }
18 }

先序遍历改,得各结点的HuffmanCode

Decode:

  好像不是很难,就不放了,照着思路往下做就行。(主要我写的不是很好看...)

运行结果

ps: HuffmanCode不是唯一的,是根据你生成的HuffmanTree 和 你定义的Code规则而定,比如说我的Code规则是左0右1。

行,那就先这样吧,这代码写了好久都有些遗忘了,幸好之前做了思维导图,希望能帮助到你。

数据结构实验代码分享 - 3 (哈夫曼树 / HuffmanTree)的更多相关文章

  1. 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现

    0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...

  2. Java数据结构(十二)—— 霍夫曼树及霍夫曼编码

    霍夫曼树 基本介绍和创建 基本介绍 又称哈夫曼树,赫夫曼树 给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树 霍夫曼树是带权路径长度最短的树,权值较 ...

  3. 数据结构之C语言实现哈夫曼树

    1.基本概念 a.路径和路径长度 若在一棵树中存在着一个结点序列 k1,k2,……,kj, 使得 ki是ki+1 的双亲(1<=i<j),则称此结点序列是从 k1 到 kj 的路径. 从 ...

  4. 数据结构-二叉树(6)哈夫曼树(Huffman树)/最优二叉树

    树的路径长度是从树根到每一个结点的路径长度(经过的边数)之和. n个结点的一般二叉树,为完全二叉树时取最小路径长度PL=0+1+1+2+2+2+2+… 带权路径长度=根结点到任意结点的路径长度*该结点 ...

  5. (哈夫曼树)HuffmanTree的java实现

    参考自:http://blog.csdn.net/jdhanhua/article/details/6621026 哈夫曼树 哈夫曼树(霍夫曼树)又称为最优树. 1.路径和路径长度在一棵树中,从一个结 ...

  6. javascript实现数据结构: 树和二叉树的应用--最优二叉树(赫夫曼树),回溯法与树的遍历--求集合幂集及八皇后问题

    赫夫曼树及其应用 赫夫曼(Huffman)树又称最优树,是一类带权路径长度最短的树,有着广泛的应用. 最优二叉树(Huffman树) 1 基本概念 ① 结点路径:从树中一个结点到另一个结点的之间的分支 ...

  7. 哈夫曼树(三)之 Java详解

    前面分别通过C和C++实现了哈夫曼树,本章给出哈夫曼树的java版本. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载请注明出处:htt ...

  8. 哈夫曼树(二)之 C++详解

    上一章介绍了哈夫曼树的基本概念,并通过C语言实现了哈夫曼树.本章是哈夫曼树的C++实现. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载 ...

  9. 哈夫曼树(一)之 C语言详解

    本章介绍哈夫曼树.和以往一样,本文会先对哈夫曼树的理论知识进行简单介绍,然后给出C语言的实现.后续再分别给出C++和Java版本的实现:实现的语言虽不同,但是原理如出一辙,选择其中之一进行了解即可.若 ...

  10. poj3253 Fence Repair【哈夫曼树+优先队列】

    Description Farmer John wants to repair a small length of the fence around the pasture. He measures ...

随机推荐

  1. JS4-BOM浏览器对象类型

    什么是BOM 浏览器的顶级对象 页面加载事件以及注意事项 定时器函数 JS执行机制 页面跳转.刷新 history.navigator对象 什么是BOM 浏览器对象模型(Browser Object ...

  2. tp5.1 controller 名称自动转换大小写,导致文件名对不上 url_convert

    // 是否自动转换URL中的控制器和操作名 'url_convert' => false, // true,

  3. 基于ADS1292芯片的解决方案之芯片简析

    基本资料: ADS1292芯片是多通道同步采样 24 位 Δ-Σ 模数转换器 (ADC),它们具有内置的可编程增益放大器 (PGA).内部基准和板载振荡器. ADS1292 包含 便携式 低功耗医疗心 ...

  4. Java加密技术(五)——非对称加密算法的由来DH

    Java非对称加密算法dh     接下来我们分析DH加密算法,一种适基于密钥一致协议的加密算法. DH Diffie-Hellman算法(D-H算法),密钥一致协议.是由公开密钥密码体制的奠基人Di ...

  5. P2602 [ZJOI2010] 数字计数:数位DP

    https://www.luogu.com.cn/problem/P2602 // #include <iostream> // #include <iomanip> // # ...

  6. Android 开发day1

    下载了安卓开发软件 Android studio 下载过程中遇到了,C盘默认安装路径不匹配问题,因为我的系统文件是中文的,软件是国外的软件,导致了他不让我安装,我还是最后在C盘创建了一个文件后,直接安 ...

  7. 总体最小二乘法(Total Least Squares)拟合直线

    前言 最小二乘法是最小化每个点到直线的垂直误差,由于误差采用的是垂直误差,导致越接近垂直线(平行于\(y\)轴),拟合效果越差,无法拟合垂直线. 通过最小化每个点到直线的距离误差可以解决最小二乘法无法 ...

  8. 您真的了解Java中的锁吗?这7种不同维度下的锁知道吗?

    写在开头 在上几篇博文中,我们聊到过volatile关键字,用它修饰变量可以保证可见性与有序性,但它并不是锁,在使用时并不会阻塞线程,且不保证原子性,属于一种轻量级.高效的同步方式,因此,如果我们的使 ...

  9. TP6框架--CRMEB学习笔记:项目初始化+环境配置

    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 最近在研究一个基于TP6的框架CRMEB,这里分享下我的开发心得 首先要获取原始项目文件 这里是git地址 https://gitee.c ...

  10. FPGA中的速度优化

    FPGA中的速度优化 一.逻辑设计中的速度概念 逻辑设计速度相关的概念有三个:设计吞吐量.设计延时和设计时序.速度优化策略而言,吞吐量需要提高,延时应该降低,时序应该收敛(时序余量slave越大,收敛 ...