数据结构之Huffman树与最优二叉树
最近在翻炒一些关于树的知识,发现一个比较有意思的二叉树,huffman树,对应到离散数学中的一种名为最优二叉树的路径结构,而Huffman的主要作用,最终可以归结到一种名为huffman编码的编码方式,使用huffman编码方式,我们可以以平均长度最短的码字来记录一串信息,且每个信息分子的编码唯一,独立。从而最终合成编码所对应的信息唯一,无歧义。
huffman树的创建时基于每个信息分子都拥有其权重,权重越大,越靠近树根,即路径越短,
下面我们我们来以一个huffman树的例子为例:简单引入一下huffman树:

上图即是构造huffman编码所必备的元素,那么,通过上图中的信息分子与对应编码,我们就可以写出编码解析结果唯一且无歧义的编码串 如:
001011110100111 CDGFH
000111110010 CHEF
huffman编码的任何组合方式都只可能对应一串信息,不可能有歧义出现。 因为在huffman树中,每一个信息元都是一个叶子节点。。。
期huffman树形结果为:

圆圈中的数字表示权重,我们规定向左为0 向右为1 ,, 即的到上面表格中的huffman编码,通过上图中的树,我们不难算出树的权
W(T)为291651 必为所有的由这些信息元组合成的树中的权的最小值,当然,组合方式有可能不一样,但最终的权,只会大于或等于他,即不存在与权值相等且为最小权值的非同构的两颗树。
如何创建这个huffman树(最优二叉树)呢,这才是我们今天的关键。
首先我们需要明确一样东西,基于信息元所创建的huffman树的节点个数是否确定,答案是肯定的,如果在一开始我们所要创建的数据结构的长度是确定的话,那么我觉得我们有很大的必要选择数组了。
数组的长度:m = 信息元个数n * 2 - 1; 即我们需要n个单元存放信息元节点,n-1的单元来存放分支点(内点和根节点)。
数组单元的数据结构(不考虑信息元数据):

由于树的存储结构是用数组实现的,故parent,rchild,lchild中直接保存数组下标即可。
一切都具备好了,那哥们儿几个就来初始化一下这棵树把(以上面的例子为例):
(初始状态,还未进行建树):

建树动作完成之后:

咦,中间的步骤哪里去了呢??? 别急!!!
听我说: 1:寻找数组中单元数据的parent不为零的两个数组元c1 , c2
2:找到他们的父节点father,父节点:数组index递增序列中第一个weight为零的数组元(前提:信息元中不存在weight为零的权)。
3:将父节点的lchild指向c1 和 c2中序号(index)在前面的那个数组单元(即lchild = indexMin(c1,c2).index), rchild则等于另一个的index,将c1和c2的parent都指向找到的父节点,即c1/c2.parent = father.index。同时c1和c2的权之和赋给father的weight(权)
4:重复1,2,3,直到左右数组单元的weight都被数据化(赋值)。
代码如下:
void HuffmanCoding(HuffmanTree *HT,int *w,int n)
{ /*w为权值数组,n为信息元个数*/
int m,i,s1,s2;
HuffmanTree p;
char *cd;
if(n<=)
return;
m=*n-;
*HT=(HuffmanTree)malloc((m+)*sizeof(HTNode)); /* 0号单元未用 */
for(p=*HT+,i=;i<=n;++i,++p,++w) //parent lcahid rchild全部初始化为零
{
(*p).weight=*w;
(*p).parent=;
(*p).lchild=;
(*p).rchild=;
}
for(;i<=m;++i,++p)
(*p).parent=;
for(i=n+;i<=m;++i) /* 建赫夫曼树 */
{ /* 在HT[1~i-1]中选择parent为0且weight最小的两个结点,其序号分别为s1和s2 */
select(*HT,i-,&s1,&s2);
(*HT)[s1].parent=(*HT)[s2].parent=i;
(*HT)[i].lchild=s1;
(*HT)[i].rchild=s2;
(*HT)[i].weight=(*HT)[s1].weight+(*HT)[s2].weight;
}
}
那么,最终的huffman编码如何实现,以及我们如何起实现反编码(从编码得到信息),笔者将会最今后的日子里进行探讨(没时间啦啦),阿里亚瑟哦,觉得不错的话,记得点赞哦。
数据结构之Huffman树与最优二叉树的更多相关文章
- 数据结构-二叉树(6)哈夫曼树(Huffman树)/最优二叉树
树的路径长度是从树根到每一个结点的路径长度(经过的边数)之和. n个结点的一般二叉树,为完全二叉树时取最小路径长度PL=0+1+1+2+2+2+2+… 带权路径长度=根结点到任意结点的路径长度*该结点 ...
- Huffman树与最优二叉树续
OK,昨天我们对huffman数的基本知识,以及huffman树的创建做了一些简介,http://www.cnblogs.com/Frank-C/p/5017430.html 今天接着聊: huffm ...
- 哈夫曼树【最优二叉树】【Huffman】
[转载]只为让价值共享,如有侵权敬请见谅! 一.哈夫曼树的概念和定义 什么是哈夫曼树? 让我们先举一个例子. 判定树: 在很多问题的处理过程中,需要进行大量的条件判断,这些判断结构的设 ...
- 【数据结构】Huffman树
参照书上写的Huffman树的代码 结构用的是线性存储的结构 不是二叉链表 里面要用到查找最小和第二小 理论上锦标赛法比较好 但是实现好麻烦啊 考虑到数据量不是很大 就直接用比较笨的先找最小 去掉最小 ...
- 数据结构与算法(周鹏-未出版)-第六章 树-6.5 Huffman 树
6.5 Huffman 树 Huffman 树又称最优树,可以用来构造最优编码,用于信息传输.数据压缩等方面,是一类有着广泛应用的二叉树. 6.5.1 二叉编码树 在计算机系统中,符号数据在处理之前首 ...
- [数据结构与算法]哈夫曼(Huffman)树与哈夫曼编码
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
- HUFFMAN 树
在一般的数据结构的书中,树的那章后面,著者一般都会介绍一下哈夫曼(HUFFMAN) 树和哈夫曼编码.哈夫曼编码是哈夫曼树的一个应用.哈夫曼编码应用广泛,如 JPEG中就应用了哈夫曼编码. 首先介绍什么 ...
- Huffman树及其应用
哈夫曼树又称为最优二叉树,哈夫曼树的一个最主要的应用就是哈夫曼编码,本文通过简单的问题举例阐释哈夫曼编码的由来,并用哈夫曼树的方法构造哈夫曼编码,最终解决问题来更好的认识哈夫曼树的应用--哈夫曼编码. ...
- Huffman树的构造及编码与译码的实现
哈夫曼树介绍 哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树.所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数) ...
随机推荐
- Duanxx的STM32学习: 启动模式,BOOT0和BOOT1具体解释
在画STM32的电路图的时候,关于STM32的启动方式纠结了一下,现有的參考设计都是在STM32的启动选择引脚BOOT0和BOOT1上使用了跳帽,用以人工选择STM32的启动方式,可是在实际应用中这样 ...
- Windows下Git服务器搭建[转]
Windows下Git服务器搭建 作为对前两天Git服务器搭建的一个整理,我想分别从服务端和客户端两个角度来记录下整个搭建过程,为了达到目标,我们需要哪些操作. (一)服务端软件和账号的安装配置 ...
- 返璞归真 asp.net mvc (4) - View/ViewEngine
原文:返璞归真 asp.net mvc (4) - View/ViewEngine [索引页] [源码下载] 返璞归真 asp.net mvc (4) - View/ViewEngine 作者:web ...
- Android学习小Demo(19)利用Loader来实时接收短信
之前写过一篇文章<Android学习小Demo(13)Android中关于ContentObserver的使用>,在里面利用ContentOberver去监測短信URI内容的变化.我们先来 ...
- VOJ 1067 Warcraft III 守望者的烦恼 (矩阵高速功率+dp)
主题链接 明显的 dp[n] = dp[n-k] + dp[n-k+1] + ... +dp[n-1]; 然后要用矩阵来优化后面的状态转移. 也就是矩阵 0 1 0 0 a b 0 0 ...
- [Linux]于Mac在配置Linuxserver安装Nginx+PHP
Linux 安装Debian系统 我安装的是Debian7.5的系统,Debian的软件包管理和升级十分方便,并且系统也非常稳定. 安装盘能够去华中科技大学镜像.网易开源镜像站或者中国科技大学镜像下载 ...
- 修饰模式(Decorator结构化)C#简单的例子
修饰模式(Decorator结构化)C#简单的例子 播放器的基本功能是移动.执行等.BaseAbility 新增功能:1.伤害技能harmAbility:2.阻碍技能BaulkAbility:3.辅助 ...
- 三思考,实现自己定义404页:Tomcat、SpringMVC精确匹配、重写DispatchServlet
第1种方式:Tomcat直接处理 web.xml <error-page> <error-code>404</error-code> <location> ...
- 前端javascript模板
doT.js——前端javascript模板引擎问题备忘录 我手里维护的一个项目,遇到一个问题:原项目的开发人员在Javascript中,大量的拼接HTML,导致代码极丑,极难维护.他们怎么能够忍受的 ...
- java并行体系结构
并行编程 线程通信 共享内存和消息传递 线程同步 控制不同线程的运行顺序 java并发 基于共享内存模型 指令重排序 编译器重排序 处理器重排序 cpu重排序 写缓存区(cache.寄存器) 内存屏障 ...