Huffman树及其编码(STL array实现)

这篇随笔主要是Huffman编码，构建哈夫曼树有各种各样的实现方法，如优先队列，数组构成的树等，但本质都是堆。

这里我用数组来存储数据，以堆的思想来构建一个哈弗曼树，并存入vector中，进而实现哈夫曼编码

步骤：　　1生成哈夫曼树（取最小权值树和次小权值树生成新树，排列后重新取树，不断重复）

　　　　 2编码（遵循左零右一的原则）

　　 3解码（是编码的逆向，本文还未实现，日后有机会补充）

data.txt 测试数据：

5
1 2 3 4 5
abcde

结果：

下面贴代码：

 #include <iostream>

 #include <fstream>

 #include <algorithm>

 #include <vector>

 #include <array>

 using namespace std;

 #define ARR_SIZE 100   //缓冲区大小

 typedef struct Tree

 {

     int freq;

     char key = '\0';

     Tree *left, *right;

     Tree()

     {

         freq = ;

         key = '\0';

         left = NULL;

         right = NULL;

     }

 } Tree, *pTree;

 union key_or_point

 {

     char key;

     pTree point;

 };

 enum infor_type

 {

     key_s,

     point_s

 };

 class infor

 {

 public:

     int freq;//权值

     key_or_point kp;//记录键值或者 新生成的树的地址

     infor_type type;//  联合体key_or_point的类型由infor_type标志

     infor()

     {

         freq = ;

         kp.key = NULL;

         type = key_s;

     }

 };

 array<infor, ARR_SIZE> arr;//用来读取要处理的数据

 vector<pTree> trees;  //所有生成的树都放在vector里面

 int num;   //要处理的数据个数

 bool cmp(infor a, infor b)

 {

     return a.freq > b.freq;

 }

 void Huffman()

 {

     //找出最小权值和次小权值

     sort(&arr[], &arr[num], cmp);

     int cal = num - ;

     while (cal > )

     {

         pTree pta = new Tree();

         vector<pTree>::iterator it;

         pTree ptl = new Tree();

         ptl->freq = arr[cal].freq;

         // pt all 的左子树

         if (arr[cal].type == point_s)

         {

             pta->left = arr[cal].kp.point;//如果存放的是地址，那么该树已入vector

             //无需重复操作

         }

         else

         {

             ptl->key = arr[cal].kp.key;

             trees.push_back(ptl);

             it = trees.end() - ;

             pta->left = *it;

         }

         pTree ptr = new Tree();

         ptr->freq = arr[cal - ].freq;

         // pt all 的右子树

         if (arr[cal - ].type == point_s)

         {

             pta->right = arr[cal - ].kp.point; //如果存放的是地址，那么该树已入vector

             //无需重复操作

         }

         else

         {

             ptr->key = arr[cal - ].kp.key;

             trees.push_back(ptr);

             it = trees.end() - ;

             pta->right = *it;

         }

         pta->freq = arr[cal].freq + arr[cal - ].freq;

         trees.push_back(pta);//pt all 本树

         it = trees.end() - ;

         arr[cal - ].kp.point = *it;

         arr[cal - ].type = point_s;//保存新生成树的地址

         arr[cal - ].freq = arr[cal - ].freq + arr[cal ].freq;

         //最小权值的树和次权值的树组成新树后，放回原数组

         //新树的key_or_point此时类型变为point_s指针指向vector存放的位置

         //第一次循环会有三棵树入vector,重新排列后，新树无需重复入vector

         cal--;

         sort(&arr[], &arr[cal + ], cmp);

     }

 }

 void traversTree(pTree pt, string st = "")

 {

     //中序遍历二叉树

     //遵循左0右1的原则

     if (pt->left == NULL && pt->right == NULL)

     {

         cout.flags(ios::left);

         cout.width();

         cout << st.c_str() << "  ";

         cout << pt->key << endl;

         return;

     }

     if (pt->left != NULL)

     {

         st += '';

         traversTree(pt->left, st);

         st.pop_back();//从左边出来后要回退一个字符，避免进入右边时多出一个字符

     }

     if (pt->right != NULL)

     {

         st += '';

         traversTree(pt->right, st);

     }

     return ;

 }

 void printCode()

 {

     vector<pTree>::iterator it;

     it = trees.end() - ;

     pTree pt = *it; //取出最顶端的树

     cout << "print HuffmanCode:" << endl;

     traversTree(pt);

 }

 int main()

 {

     ifstream filein("data.txt");

     cin.rdbuf(filein.rdbuf());//重定向输入

     cin >> num;//要处理的数据个数

     for (int i = ; i < num; i++)

     {

         cin >> arr[i].freq;

     }

     for (int i = ; i < num; i++)

     {

         cin >> arr[i].kp.key;

     }

     Huffman();

     printCode();

     return ;

 }

分析：

这是以上测试数据生成的树的情况。

只有叶子节点表示有效的符号，所以遍历树时返回条件是叶子节点（如果是叶子节点则返回）

总结：

1 编程时用的一些小技巧总结：

　　1.1 输出调试信息：可以采用如下方式

　　　　　　#ifdef DEBUG

　　　　　　　　cout调试信息....

　　　　　　#endif

　　1.2 联合体union需要取得类型时，可以加一个enum来记录和标志uninon的类型

2 编程方法反思：

　　可以看到源码中用到了两次sort，这是省事的做法了。

　　目前想到的改进的方法是用二分插入（数据已经排序）

　　对比起来，我觉得优先队列的方式更易懂且效率更高，但此文也算是一次小探索，值得记录下来

3 感想：

　　本人入园第一次随笔，如有不足或错误，还望指出。

以上

Huffman树及其编码(STL array实现)的更多相关文章

Huffman树的编码译码
上个学期做的课程设计,关于Huffman树的编码译码. 要求: 输入Huffman树各个叶结点的字符和权值,建立Huffman树并执行编码操作输入一行仅由01组成的电文字符串,根据建立的Huffma ...
Huffman树与编码
带权路径最小的二叉树称为最优二叉树或Huffman(哈夫曼树). Huffman树的构造将节点的权值存入数组中,由数组开始构造Huffman树.初始化指针数组,指针指向含有权值的孤立节点. b = ...
Huffman树与编码的简单实现
好久没写代码了,这个是一个朋友问的要C实现,由于不会C,就用JAVA写了个简单的.注释掉的代码属性按照原来朋友发的题里带的参数,发现没什么用就给注释掉了. package other; import ...
Huffman树进行编码和译码
//编码#include<iostream> #include<cstdio> #include<cstring> #include<cstdlib> ...
Huffman树及其编解码
Huffman树--编解码介绍: Huffman树可以根据输入的字符串中某个字符出现的次数来给某个字符设定一个权值,然后可以根据权值的大小给一个给定的字符串编码,或者对一串编码进行解码,可以用于 ...
构造数列Huffman树总耗费_蓝桥杯
快排! /** 问题描述 Huffman树在编码中有着广泛的应用.在这里,我们只关心Huffman树的构造过程. 给出一列数{pi}={p0, p1, …, pn-1},用这列数构造Huffman树的 ...
Java蓝桥杯练习题——Huffman树
Huffman树在编码中有着广泛的应用.在这里,我们只关心Huffman树的构造过程. 给出一列数{pi}={p0, p1, -, pn-1},用这列数构造Huffman树的过程如下: 找到{pi}中 ...
[数据结构与算法]哈夫曼(Huffman)树与哈夫曼编码
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
huffman树即Huffma编码的实现
自己写的Huffman树生成与Huffman编码实现 (实现了核心功能 ,打出了每个字符的huffman编码其他的懒得实现了,有兴趣的朋友可以自己在我的基础增加功能 ) /* 原创文章转载请附上原 ...

随机推荐

js如何获取地址栏上的参数id
直接上js代码方法1: 父页面跳转地址栏带id>>>>window.location.href='${ctxAdmin}/study/checkForm?id='+id+ ...
HMM（隐马尔科夫）用于中文分词
隐马尔可夫模型(Hidden Markov Model,HMM)是用来描述一个含有隐含未知参数的马尔可夫过程. 本文阅读了2篇blog,理解其中的意思,附上自己的代码,共同学习. 一.理解隐马尔科夫 ...
SpringBoot2集成Activiti6
Activiti是领先的轻量级的,以Java为中心的开源BPMN(Business Process Modeling Notation)引擎,实现了真正的流程自动化.下面介绍如何在SpringBoot ...
xshell评估期已过怎么办
重新下载更新即可,不要看到英文一脸懵逼,直接在页面中有红色*号的地方输入个人信息,licensetype 必须选 Home and School use(家庭和个人使用),最主要的是输入邮箱(必须是个 ...
linux mysql 查看默认端口号和修改端口号
如何查看mysql 默认端口号和修改端口号 2015-03-19 17:42:18 1. 登录mysql [root@test /]# mysql -u root -p Enter password: ...
【codeforces 761D】Dasha and Very Difficult Problem
time limit per test2 seconds memory limit per test256 megabytes inputstandard input outputstandard o ...
P1100 三连击
题目描述我们假设一个三位整数 $N(100 \le N \le 999)$ ,它的百位上的数字是 $A$ ,十位上的数字是 $B$ ,个位上的数字是 $C$ ,如果 $A$ , ...
linux模块加载竞争
到目前, 我们的讨论已来到一个模块加载的重要方面: 竞争情况. 如果你在如何编写你的初始化函数上不小心, 你可能造成威胁到整个系统的稳定的情形. 我们将在本书稍后讨论竞争情况; 现在, 快速提几点 ...
H3C TFTP文件传输过程
聚类——DBSCAN
转载自: https://www.cnblogs.com/pinard/p/6208966.html http://www.cnblogs.com/pinard/p/6217852.html http ...

Huffman树及其编码(STL array实现)

Huffman树及其编码(STL array实现)的更多相关文章

随机推荐

热门专题