HuffmanTree,哈夫曼树的原理和c++实现
一、什么是哈夫曼树
哈夫曼树又称为最优树.
通过权值来构造树,权值越大,离根节点越近
经常用于无损压缩算法
用于需要优化存储空间的场景
原理很简单,不多赘述
具体看百度百科的解释
需要注意 构建哈夫曼树不仅要值,还需要对应的权值
比如越常出现的,权值越大
二、构造哈夫曼树
通过权值来构造哈夫曼树
我画了几个图,具体过程如下





三、路径、编码、解码
上面通过权值构建了哈夫曼树,再将字符与权值对应起来
往左记作0 往右记作1
从根节点到各个叶子节点经过的0和1
就是该节点对应的路径


aaabbeaf编码:01010110101110011111
01010110101110011111解码:aaabbeaf
比如一个字符a原来占8位,通过哈夫曼编码后,就只占用2个位
但缺点是 权值较低的 占用字节会比较高,比如e,就占用4个位
四、代码
下面代码只是例子,编码解码并没有真的用位来表示,而是用字符串代替
HuffmanTree.h
#pragma once
#include<queue>
#include<iostream>
#include<algorithm>
#include<string>
using namespace std;
class HuffmanTree
{
struct Node
{
int weight;//权值
Node* left;//左孩子
Node* right;//右孩子
char value;//节点值
string path;//存放路径
};
//仅用于优先级队列比较
struct NodeCMP
{
bool operator()(Node* a, Node* b)
{
return a->weight > b->weight;
}
};
private:
Node* root = nullptr;
vector<pair<char, string>*>map;
public:
HuffmanTree(vector<int>& weight, vector<char>& value) {
createHuffmanTreeNode(weight,value);
createHuffmanTreePath();
}
//初始化节点
void createHuffmanTreeNode(vector<int>& weight, vector<char>& value) {
priority_queue<Node*,vector<Node*>, NodeCMP>que;//优先级队列构造树
for (size_t i = 0; i < weight.size(); i++){
Node* temp = new Node{ weight[i] ,nullptr,nullptr,value[i] };
que.push(temp);
}
while (que.size() >= 2){
Node* min1 = que.top();
que.pop();
Node* min2 = que.top();
que.pop();
Node* node = new Node{ min1->weight + min2->weight,min1,min2 };
que.push(node);
}
root = que.top();
}
//初始化路径
void createHuffmanTreePath() {
if (root == nullptr)return;
queue<Node*>que;
que.push(root);
while (que.size()){
Node* temp = que.front();
que.pop();
if (temp->left != nullptr) {
que.push(temp->left);
temp->left->path.append(temp->path + 0);
}
if (temp->right != nullptr){
que.push(temp->right);
temp->right->path.append(temp->path + 1);
}
if (temp->left == nullptr && temp->right == nullptr) {
map.push_back(new pair<char, string>(temp->value, temp->path));
}
}
}
string encode(string data) {
string result;
for (size_t i = 0; i < data.size(); i++) {
char ch = data[i];
for (size_t j = 0; j < map.size(); j++) {
pair<char, string>* mapData = map[j];
if (mapData->first == ch) {
result.append(mapData->second);
break;
}
}
}
return result;
}
string decode(string data) {
string result;
while (data.size())
{
for (size_t i = 0; i < map.size(); i++)
{
pair<char, string>* mapData = map[i];
if (data.find(mapData->second) == 0) {
result.push_back(mapData->first);
data = data.substr(mapData->second.size());
break;
}
}
}
return result;
}
};
main.cpp
#include<iostream>
#include<vector>
#includeHuffmanTree.h
int main()
{
vector<int>weight = { 8,9,7,4,2,3 };
vector<char>value = { 'a','b','c','d','e','f'};
HuffmanTree tree(weight,value);
string str;
str = tree.encode(aaabbeaf);
cout << str << endl;
str = tree.decode(str);
cout << str << endl;
return 0;
}
HuffmanTree,哈夫曼树的原理和c++实现的更多相关文章
- (哈夫曼树)HuffmanTree的java实现
参考自:http://blog.csdn.net/jdhanhua/article/details/6621026 哈夫曼树 哈夫曼树(霍夫曼树)又称为最优树. 1.路径和路径长度在一棵树中,从一个结 ...
- 6-9-哈夫曼树(HuffmanTree)-树和二叉树-第6章-《数据结构》课本源码-严蔚敏吴伟民版
课本源码部分 第6章 树和二叉树 - 哈夫曼树(HuffmanTree) ——<数据结构>-严蔚敏.吴伟民版 源码使用说明 链接☛☛☛ <数据结构-C语言版> ...
- 【算法】赫夫曼树(Huffman)的构建和应用(编码、译码)
参考资料 <算法(java)> — — Robert Sedgewick, Kevin Wayne <数据结构> ...
- 20172332 2017-2018-2 《程序设计与数据结构》Java哈夫曼编码实验--哈夫曼树的建立,编码与解码
20172332 2017-2018-2 <程序设计与数据结构>Java哈夫曼编码实验--哈夫曼树的建立,编码与解码 哈夫曼树 1.路径和路径长度 在一棵树中,从一个结点往下可以达到的孩子 ...
- 【algo&ds】【吐血整理】4.树和二叉树、完全二叉树、满二叉树、二叉查找树、平衡二叉树、堆、哈夫曼树、B树、字典树、红黑树、跳表、散列表
本博客内容耗时4天整理,如果需要转载,请注明出处,谢谢. 1.树 1.1树的定义 在计算机科学中,树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结 ...
- 哈夫曼树详解——PHP代码实现
在介绍哈夫曼树之前需要先了解一些专业术语 路径和路径长度 在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径.通路中分支的数目称为路径长度.若规定根结点的层数为1,则从根结点到第L ...
- C++哈夫曼树编码和译码的实现
一.背景介绍: 给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的 ...
- 哈夫曼树(一)之 C语言详解
本章介绍哈夫曼树.和以往一样,本文会先对哈夫曼树的理论知识进行简单介绍,然后给出C语言的实现.后续再分别给出C++和Java版本的实现:实现的语言虽不同,但是原理如出一辙,选择其中之一进行了解即可.若 ...
- 【数据结构】赫夫曼树的实现和模拟压缩(C++)
赫夫曼(Huffman)树,由发明它的人物命名,又称最优树,是一类带权路径最短的二叉树,主要用于数据压缩传输. 赫夫曼树的构造过程相对比较简单,要理解赫夫曼数,要先了解赫夫曼编码. 对一组出现频率不同 ...
- Android版数据结构与算法(七):赫夫曼树
版权声明:本文出自汪磊的博客,未经作者允许禁止转载. 近期忙着新版本的开发,此外正在回顾C语言,大部分时间没放在数据结构与算法的整理上,所以更新有点慢了,不过既然写了就肯定尽力将这部分完全整理好分享出 ...
随机推荐
- 【Azure 存储服务】使用POST方式向Azure Storage Queue中插入Message的办法
问题描述 使用POST HTTP Request, 如何向Azure Storage Queue中写入Message呢?例如使用CURL发送POST指令是否可以呢? CURL -H "Con ...
- 使用beyond compare或kompare作为git的对比、合并工具
两种方法 方法1: 直接使用命令 # 执行下面命令,参看支持对比合并工具名称,比如bc就是指beyond compare(收费软件,推荐使用开源的kompare) $ git difftool --t ...
- Codeforces Round 169 (Div. 2)C. Little Girl and Maximum Sum(差分、贪心)
目录 题面 链接 题意 题解 代码 总结 题面 链接 C. Little Girl and Maximum Sum 题意 给q个[l,r]将所有这些区间里面的数相加和最大. 可以进行的操作是任意排列数 ...
- Dendron vscode笔记插件 F12 可自动跳转 页面 很实用
Dendron vscode笔记插件 F12 可自动跳转 页面 很实用 Dendron 技巧汇总 新建工作区 新建一个 工作区 建立一个空目录 然后 ctrl + shift P 输入 init 就可 ...
- 基于python的固定间隔时间执行实例解析
一 概念 datetime的用法如下: import datetime. # 打印当前时间 time1 = datetime.datetime.now() print(time1) # 打印按指定格式 ...
- Docker 部署GitLabs 版本升级 13.9.x -> 15.3.x
Gitlabs版本升级大版本不能直接跳级升级, 可以参考官方的升级路径.本人是从13.9.x需要升级到最新的15.3.x. 参考官方路径结合自己的实际情况成功升级. 13.9.0 -> 13.1 ...
- Spring boot返回时间与MySql数据库中不相同问题及解决方法
最近做项目测试的发现,访问Url返回的时间与数据库中的不相同,环境是Spring boot+MyBatis+Mysql(阿里云服务器),经过一番折腾,得到了解决 问题描述 我是直接使用IDEA的数据库 ...
- Linux查看用户的7个命令
Linux是中国IT实验室的一个技术频道.包含桌面应用,Linux系统管理,内核研究,嵌入式系统和开源等一些基本分类 在Linux系统里,我们会经常用Linux查看用户的命令,在这里我们一些 ...
- new vs malloc
https://www.cnblogs.com/qg-whz/p/5140930.html 1.申请内存位置 new操作符从自由存储区(free store)上为对象动态分配内存空间,而malloc函 ...
- 【Unity干货教程】如何实现Unity和Android原生互相调用?
Unity是一个跨平台开发工具,发布到移动平台也是大部分Unity开发者的必备技能.而由于Unity跨平台的特性,总会遇到在移动平台的技术细节支持不够,或者需要在调用其他原生插件的情况.这里我们说一下 ...