哈夫曼树的介绍

Huffman Tree,中文名是哈夫曼树或霍夫曼树,它是最优二叉树。

定义:给定n个权值作为n个叶子结点,构造一棵二叉树,若树的带权路径长度达到最小,则这棵树被称为哈夫曼树。 这个定义里面涉及到了几个陌生的概念,下面就是一颗哈夫曼树,我们来看图解答。

(01) 路径和路径长度

定义:在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1。 
例子:100和80的路径长度是1,50和30的路径长度是2,20和10的路径长度是3。

(02) 结点的权及带权路径长度

定义:若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。 
例子:节点20的路径长度是3,它的带权路径长度= 路径长度 * 权 = 3 * 20 = 60。

(03) 树的带权路径长度

定义:树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。 
例子:示例中,树的WPL= 1*100 + 2*80 + 3*20 + 3*10 = 100 + 160 + 60 + 30 = 350。

比较下面两棵树

上面的两棵树都是以{10, 20, 50, 100}为叶子节点的树。

左边的树WPL=2*10 + 2*20 + 2*50 + 2*100 = 360 
右边的树WPL=350

左边的树WPL > 右边的树的WPL。你也可以计算除上面两种示例之外的情况,但实际上右边的树就是{10,20,50,100}对应的哈夫曼树。至此,应该堆哈夫曼树的概念有了一定的了解了,下面看看如何去构造一棵哈夫曼树。

哈夫曼树的图文解析

假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,哈夫曼树的构造规则为:

1. 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点); 
2. 在森林中选出根结点的权值最小的两棵树进行合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和; 
3. 从森林中删除选取的两棵树,并将新树加入森林; 
4. 重复(02)、(03)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。

以{5,6,7,8,15}为例,来构造一棵哈夫曼树。

第1步:创建森林,森林包括5棵树,这5棵树的权值分别是5,6,7,8,15。 
第2步:在森林中,选择根节点权值最小的两棵树(5和6)来进行合并,将它们作为一颗新树的左右孩子(谁左谁右无关紧要,这里,我们选择较小的作为左孩子),并且新树的权值是左右孩子的权值之和。即,新树的权值是11。 然后,将"树5"和"树6"从森林中删除,并将新的树(树11)添加到森林中。 
第3步:在森林中,选择根节点权值最小的两棵树(7和8)来进行合并。得到的新树的权值是15。 然后,将"树7"和"树8"从森林中删除,并将新的树(树15)添加到森林中。 
第4步:在森林中,选择根节点权值最小的两棵树(11和15)来进行合并。得到的新树的权值是26。 然后,将"树11"和"树15"从森林中删除,并将新的树(树26)添加到森林中。 
第5步:在森林中,选择根节点权值最小的两棵树(15和26)来进行合并。得到的新树的权值是41。 然后,将"树15"和"树26"从森林中删除,并将新的树(树41)添加到森林中。 
此时,森林中只有一棵树(树41)。这棵树就是我们需要的哈夫曼树!

哈夫曼树的基本操作

哈夫曼树的重点是如何构造哈夫曼树。本文构造哈夫曼时,用到了以前介绍过的"(二叉堆)最小堆"。下面对哈夫曼树进行讲解。

1. 基本定义

template <class T>
class HuffmanNode{
public:
T key; // 权值
HuffmanNode *left; // 左孩子
HuffmanNode *right; // 右孩子
HuffmanNode *parent;// 父结点 HuffmanNode(){}
HuffmanNode(T value, HuffmanNode *l, HuffmanNode *r, HuffmanNode *p):
key(value),left(l),right(r),parent(p) {}
};

HuffmanNode是哈夫曼树的节点类。

template <class T>
class Huffman {
private:
HuffmanNode<T> *mRoot; // 根结点 public:
Huffman();
~Huffman(); // 前序遍历"Huffman树"
void preOrder();
// 中序遍历"Huffman树"
void inOrder();
// 后序遍历"Huffman树"
void postOrder(); // 创建Huffman树
void create(T a[], int size);
// 销毁Huffman树
void destroy(); // 打印Huffman树
void print();
private:
// 前序遍历"Huffman树"
void preOrder(HuffmanNode<T>* tree) const;
// 中序遍历"Huffman树"
void inOrder(HuffmanNode<T>* tree) const;
// 后序遍历"Huffman树"
void postOrder(HuffmanNode<T>* tree) const; // 销毁Huffman树
void destroy(HuffmanNode<T>* &tree); // 打印Huffman树
void print(HuffmanNode<T>* tree, T key, int direction);
};

Huffman是哈夫曼树对应的类,它包含了哈夫曼树的根节点和哈夫曼树的相关操作。

2. 构造哈夫曼树

/*
* 创建Huffman树
*
* 参数说明:
* a 权值数组
* size 数组大小
*
* 返回值:
* Huffman树的根节点
*/
template <class T>
void Huffman<T>::create(T a[], int size)
{
int i;
HuffmanNode<T> *left, *right, *parent;
MinHeap<T> *heap = new MinHeap<T>(); // 建立数组a对应的最小堆
heap->create(a, size); for(i=; i<size-; i++)
{
left = heap->dumpFromMinimum(); // 最小节点是左孩子
right = heap->dumpFromMinimum(); // 其次才是右孩子 // 新建parent节点,左右孩子分别是left/right;
// parent的大小是左右孩子之和
parent = new HuffmanNode<T>(left->key+right->key, left, right, NULL);
left->parent = parent;
right->parent = parent; // 将parent节点数据拷贝到"最小堆"中
if (heap->copyOf(parent)!=)
{
cout << "插入失败!" << endl << "结束程序" << endl;
destroy(parent);
parent = NULL;
break;
}
} mRoot = parent; // 销毁最小堆
heap->destroy();
delete heap;
}

首先通过heap->create(a, size)来创建最小堆。最小堆构造完成之后,进入for循环。

每次循环时:

(01) 首先,将最小堆中的最小节点拷贝一份并赋值给left,然后重塑最小堆(将最小节点和后面的节点交换位置,接着将"交换位置后的最小节点"之前的全部元素重新构造成最小堆); 
(02) 接着,再将最小堆中的最小节点拷贝一份并将其赋值right,然后再次重塑最小堆; 
(03) 然后,新建节点parent,并将它作为left和right的父节点; 
(04) 接着,将parent的数据复制给最小堆中的指定节点。

二叉堆中已经介绍过堆,这里就不再对堆的代码进行说明了。若有疑问,直接参考后文的源码。其它的相关代码,也Please RTFSC(Read The Fucking Source Code)!

哈夫曼树的完整源码

1. 哈夫曼树的节点类 (HuffmanNode.h)

/**
* Huffman树节点类
*
* @author skywang
* @date 2014/03/25
*/ #ifndef _HUFFMAN_NODE_HPP_
#define _HUFFMAN_NODE_HPP_ template <class T>
class HuffmanNode{
public:
T key; // 权值
HuffmanNode *left; // 左孩子
HuffmanNode *right; // 右孩子
HuffmanNode *parent;// 父结点 HuffmanNode(){}
HuffmanNode(T value, HuffmanNode *l, HuffmanNode *r, HuffmanNode *p):
key(value),left(l),right(r),parent(p) {}
}; #endif

2.哈夫曼树的实现文件(Huffman.h)

/**
* C++实现的Huffman树。
*
* 构造Huffman树时,使用到了最小堆。
*
* @author skywang
* @date 2014/03/25
*/ #ifndef _HUFFMAN_TREE_HPP_
#define _HUFFMAN_TREE_HPP_ #include <iomanip>
#include <iostream>
#include "HuffmanNode.h"
#include "MinHeap.h"
using namespace std; template <class T>
class Huffman {
private:
HuffmanNode<T> *mRoot; // 根结点 public:
Huffman();
~Huffman(); // 前序遍历"Huffman树"
void preOrder();
// 中序遍历"Huffman树"
void inOrder();
// 后序遍历"Huffman树"
void postOrder(); // 创建Huffman树
void create(T a[], int size);
// 销毁Huffman树
void destroy(); // 打印Huffman树
void print();
private:
// 前序遍历"Huffman树"
void preOrder(HuffmanNode<T>* tree) const;
// 中序遍历"Huffman树"
void inOrder(HuffmanNode<T>* tree) const;
// 后序遍历"Huffman树"
void postOrder(HuffmanNode<T>* tree) const; // 销毁Huffman树
void destroy(HuffmanNode<T>* &tree); // 打印Huffman树
void print(HuffmanNode<T>* tree, T key, int direction);
}; /*
* 构造函数
*/
template <class T>
Huffman<T>::Huffman():mRoot(NULL)
{
} /*
* 析构函数
*/
template <class T>
Huffman<T>::~Huffman()
{
destroy();
} /*
* 前序遍历"Huffman树"
*/
template <class T>
void Huffman<T>::preOrder(HuffmanNode<T>* tree) const
{
if(tree != NULL)
{
cout<< tree->key << " " ;
preOrder(tree->left);
preOrder(tree->right);
}
} template <class T>
void Huffman<T>::preOrder()
{
preOrder(mRoot);
} /*
* 中序遍历"Huffman树"
*/
template <class T>
void Huffman<T>::inOrder(HuffmanNode<T>* tree) const
{
if(tree != NULL)
{
inOrder(tree->left);
cout<< tree->key << " " ;
inOrder(tree->right);
}
} template <class T>
void Huffman<T>::inOrder()
{
inOrder(mRoot);
} /*
* 后序遍历"Huffman树"
*/
template <class T>
void Huffman<T>::postOrder(HuffmanNode<T>* tree) const
{
if(tree != NULL)
{
postOrder(tree->left);
postOrder(tree->right);
cout<< tree->key << " " ;
}
} template <class T>
void Huffman<T>::postOrder()
{
postOrder(mRoot);
} /*
* 创建Huffman树
*
* 参数说明:
* a 权值数组
* size 数组大小
*
* 返回值:
* Huffman树的根节点
*/
template <class T>
void Huffman<T>::create(T a[], int size)
{
int i;
HuffmanNode<T> *left, *right, *parent;
MinHeap<T> *heap = new MinHeap<T>(); // 建立数组a对应的最小堆
heap->create(a, size); for(i=; i<size-; i++)
{
left = heap->dumpFromMinimum(); // 最小节点是左孩子
right = heap->dumpFromMinimum(); // 其次才是右孩子 // 新建parent节点,左右孩子分别是left/right;
// parent的大小是左右孩子之和
parent = new HuffmanNode<T>(left->key+right->key, left, right, NULL);
left->parent = parent;
right->parent = parent; // 将parent节点数据拷贝到"最小堆"中
if (heap->copyOf(parent)!=)
{
cout << "插入失败!" << endl << "结束程序" << endl;
destroy(parent);
parent = NULL;
break;
}
} mRoot = parent; // 销毁最小堆
heap->destroy();
delete heap;
} /*
* 销毁Huffman树
*/
template <class T>
void Huffman<T>::destroy(HuffmanNode<T>* &tree)
{
if (tree==NULL)
return ; if (tree->left != NULL)
return destroy(tree->left);
if (tree->right != NULL)
return destroy(tree->right); delete tree;
tree=NULL;
} template <class T>
void Huffman<T>::destroy()
{
destroy(mRoot);
} /*
* 打印"Huffman树"
*
* key -- 节点的键值
* direction -- 0,表示该节点是根节点;
* -1,表示该节点是它的父结点的左孩子;
* 1,表示该节点是它的父结点的右孩子。
*/
template <class T>
void Huffman<T>::print(HuffmanNode<T>* tree, T key, int direction)
{
if(tree != NULL)
{
if(direction==) // tree是根节点
cout << setw() << tree->key << " is root" << endl;
else // tree是分支节点
cout << setw() << tree->key << " is " << setw() << key << "'s " << setw() << (direction==?"right child" : "left child") << endl; print(tree->left, tree->key, -);
print(tree->right,tree->key, );
}
} template <class T>
void Huffman<T>::print()
{
if (mRoot != NULL)
print(mRoot, mRoot->key, );
} #endif

3.哈夫曼树对应的最小堆(MinHeap.h)

/**
* 最小堆:为Huffman树服务的。
*
* @author skywang
* @date 2014/03/25
*/ #ifndef _HUFFMAN_MIN_HEAP_HPP_
#define _HUFFMAN_MIN_HEAP_HPP_ #include "HuffmanNode.h" template <class T>
class MinHeap {
private:
HuffmanNode<T> *mHeap; // 最小堆的数组
int mCapacity; // 总的容量
int mSize; // 当前有效数据的数量
private:
// 上调算法
void filterUp(int start);
// 下调算法
void filterDown(int start, int end);
// 交换两个HuffmanNode节点的全部数据,i和j是节点索引。
void swapNode(int i, int j);
public:
MinHeap();
~MinHeap(); // 将node的全部数据拷贝给"最小堆的指定节点"
int copyOf(HuffmanNode<T> *node);
// 获取最小节点
HuffmanNode<T>* dumpFromMinimum();
// 创建最小堆
void create(T a[], int size);
// 销毁最小堆
void destroy();
}; template <class T>
MinHeap<T>::MinHeap()
{
} template <class T>
MinHeap<T>::~MinHeap()
{
destroy();
} /*
* 最小堆的向下调整算法
*
* 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
*
* 参数说明:
* start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
* end -- 截至范围(一般为数组中最后一个元素的索引)
*/
template <class T>
void MinHeap<T>::filterDown(int start, int end)
{
int c = start; // 当前(current)节点的位置
int l = *c + ; // 左(left)孩子的位置
HuffmanNode<T> tmp = mHeap[c]; // 当前(current)节点 while(l <= end)
{
// "l"是左孩子,"l+1"是右孩子
if(l < end && mHeap[l].key > mHeap[l+].key)
l++; // 左右两孩子中选择较小者,即mHeap[l+1]
if(tmp.key <= mHeap[l].key)
break; //调整结束
else
{
mHeap[c] = mHeap[l];
c = l;
l = *l + ;
}
}
mHeap[c] = tmp;
} /*
* 最小堆的向上调整算法(从start开始向上直到0,调整堆)
*
* 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
*
* 参数说明:
* start -- 被上调节点的起始位置(一般为数组中最后一个元素的索引)
*/
template <class T>
void MinHeap<T>::filterUp(int start)
{
int c = start; // 当前节点(current)的位置
int p = (c-)/; // 父(parent)结点的位置
HuffmanNode<T> tmp = mHeap[c]; // 当前节点(current) while(c > )
{
if(mHeap[p].key <= tmp.key)
break;
else
{
mHeap[c] = mHeap[p];
c = p;
p = (p-)/;
}
}
mHeap[c] = tmp;
} /*
* 将node的全部数据拷贝给"最小堆的指定节点"
*
* 返回值:
* 0,表示成功
* -1,表示失败
*/
template <class T>
int MinHeap<T>::copyOf(HuffmanNode<T> *node)
{
// 如果"堆"已满,则返回
if(mSize == mCapacity)
return -; mHeap[mSize] = *node; // 将"node的数据"全部复制到"数组末尾"
filterUp(mSize); // 向上调整堆
mSize++; // 堆的实际容量+1 return ;
} /*
* 交换两个HuffmanNode节点的全部数据
*/
template <class T>
void MinHeap<T>::swapNode(int i, int j)
{
HuffmanNode<T> tmp = mHeap[i];
mHeap[i] = mHeap[j];
mHeap[j] = tmp;
} /*
* 新建一个节点,并将最小堆中最小节点的数据复制给该节点。
* 然后除最小节点之外的数据重新构造成最小堆。
*
* 返回值:
* 失败返回NULL。
*/
template <class T>
HuffmanNode<T>* MinHeap<T>::dumpFromMinimum()
{
// 如果"堆"已空,则返回
if(mSize == )
return NULL; HuffmanNode<T> *node;
if((node = new HuffmanNode<T>()) == NULL)
return NULL; // 将"最小节点的全部数据"复制给node
*node = mHeap[]; swapNode(, mSize-); // 交换"最小节点"和"最后一个节点"
filterDown(, mSize-); // 将mHeap[0...mSize-2]构造成一个最小堆
mSize--; return node;
} /*
* 创建最小堆
*
* 参数说明:
* a -- 数据所在的数组
* size -- 数组大小
*/
template <class T>
void MinHeap<T>::create(T a[], int size)
{
int i; // 创建最小堆所对应的数组
mSize = size;
mCapacity = size;
mHeap = new HuffmanNode<T>[size]; // 初始化数组
for(i=; i<size; i++)
{
mHeap[i].key = a[i];
mHeap[i].parent = mHeap[i].left = mHeap[i].right = NULL;
} // 从(size/2-1) --> 0逐次遍历。遍历之后,得到的数组实际上是一个最小堆。
for (i = size / - ; i >= ; i--)
filterDown(i, size-);
} // 销毁最小堆
template <class T>
void MinHeap<T>::destroy()
{
mSize = ;
mCapacity = ;
delete[] mHeap;
mHeap = NULL;
}
#endif

4.哈夫曼树的测试文件(HuffmanTest.cpp)

/**
* Huffman树测试程序
*
* @author skywang
* @date 2014/03/25
*/ #include <iostream>
#include "Huffman.h"
using namespace std; int main()
{
int a[]= {,,,,};
int i, ilen = sizeof(a) / (sizeof(a[])) ;
Huffman<int>* tree=new Huffman<int>(); cout << "== 添加数组: ";
for(i=; i<ilen; i++)
cout << a[i] <<" "; tree->create(a, ilen); cout << "\n== 前序遍历: ";
tree->preOrder(); cout << "\n== 中序遍历: ";
tree->inOrder(); cout << "\n== 后序遍历: ";
tree->postOrder();
cout << endl; cout << "== 树的详细信息: " << endl;
tree->print(); // 销毁二叉树
tree->destroy(); return ;
}

本文来自http://www.cnblogs.com/skywang12345/p/3706821.html

哈夫曼树——c++的更多相关文章

  1. (哈夫曼树)HuffmanTree的java实现

    参考自:http://blog.csdn.net/jdhanhua/article/details/6621026 哈夫曼树 哈夫曼树(霍夫曼树)又称为最优树. 1.路径和路径长度在一棵树中,从一个结 ...

  2. 数据结构之C语言实现哈夫曼树

    1.基本概念 a.路径和路径长度 若在一棵树中存在着一个结点序列 k1,k2,……,kj, 使得 ki是ki+1 的双亲(1<=i<j),则称此结点序列是从 k1 到 kj 的路径. 从 ...

  3. C++哈夫曼树编码和译码的实现

    一.背景介绍: 给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的 ...

  4. 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现

    0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...

  5. 哈夫曼树---POJ3253

    http://poj.org/problem?id=3253 这就是 最典型的哈夫曼树的题型,我们就根据这道题学习一下哈夫曼树 这是最开始我们把21据下来之后我们据下8,然后再据下5得到34,可以看出 ...

  6. 哈夫曼树(三)之 Java详解

    前面分别通过C和C++实现了哈夫曼树,本章给出哈夫曼树的java版本. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载请注明出处:htt ...

  7. 哈夫曼树(二)之 C++详解

    上一章介绍了哈夫曼树的基本概念,并通过C语言实现了哈夫曼树.本章是哈夫曼树的C++实现. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载 ...

  8. 哈夫曼树(一)之 C语言详解

    本章介绍哈夫曼树.和以往一样,本文会先对哈夫曼树的理论知识进行简单介绍,然后给出C语言的实现.后续再分别给出C++和Java版本的实现:实现的语言虽不同,但是原理如出一辙,选择其中之一进行了解即可.若 ...

  9. 51nod 1117 聪明的木匠 (哈夫曼树)

    题目:传送门. 题意:中文题. 题解:就是构造一颗哈夫曼树,数据结构里的知识. #include <iostream> #include <cstdio> #include & ...

  10. FZU2219 StarCraft(哈夫曼树)

    一个工人可以变成两个工人,这样可以画出一颗二叉树,那么就是在叶子上建的建筑. 问题的时间花费,可以看作是这颗二叉树中各个叶子的深度*k+叶子对应建筑耗费时间中的最大值. 容易想到,类似哈夫曼树一样,从 ...

随机推荐

  1. 转 git push 提示 Everything up-to-date

    git 还没有分支,需要指定一个($ git remote -v),就可以push了 第一步:$ git remote -v 第二步:$ git branch 转载链接: http://blog.cs ...

  2. 怎么用js设置a标签点击链接改变当前颜色

    怎么用js设置a标签点击链接改变当前颜色 20 例如:多个a标签为白色,当点击其中一个a标签时改变那一个a标签的字体颜色为黄色,并且跳转到对应链接,当点击下一个a标签链接时,下一个为黄色,之前一个恢复 ...

  3. linux 基本工具相关

    首先是linux下安装ssh服务(root) 由于是使用debian版本 与其他稍有差别 安装服务 apt-get install ssh 查看服务是否开启 service ssh status 开启 ...

  4. 硬件GPIO,UART,I2C,SPI电路图

  5. 2018秋季C语言基础课第1次作业

    1.翻阅邹欣老师博客关于师生关系博客,并回答下列问题: 1)大学和高中最大的不同是没有人天天看着你,请看大学理想的师生关系是?有何感想? 答:是  Coach / Trainee (健身教练 / 健身 ...

  6. METAGENOMIC SEQUENCING ANALYSIS WORKFLOW

    Metagenomics is defined as the study of the metagenome, which is total genomic DNA from environmenta ...

  7. 2018.10.05 NOIP模拟 上升序列(状压dp)

    传送门 状压dp好题. 首先需要回忆O(nlogn)O(nlog n)O(nlogn)求lislislis的方法,我们会维护一个单调递增的ddd数组. 可以设计状态f(s1,s2)f(s1,s2)f( ...

  8. 2018.08.14 bzoj4241: 历史研究(回滚莫队)

    传送们 简单的回滚莫队,调了半天发现排序的时候把m达成了n... 代码: #include<bits/stdc++.h> #define N 100005 #define ll long ...

  9. C++之类和对象的使用(一)

    对象的初始化 在声明类时直接对数据成员初始化是错误的!下面的例子时错误的!! class Time{ hour =; minitu=; sec=; } //因为类并不是一个实体,而是一种抽象类型,并不 ...

  10. Linux 随记

    通配符和文件名变量:* ? [] * 查询 $ ls doc1 doc2 document mydoc monday $ ls doc* doc1 doc2 document $ ls  *day m ...