C# 霍夫曼二叉树压缩算法实现

知道有的人比较懒,直接贴全部代码.

一开始一次性Code完了压缩部分代码.只调试了2,3次就成功了.

一次性写150行代码,没遇到什么bug的感觉还是蛮爽的.

写解压代码,才发现压缩代码有些细节问题.

对最后一个字符处理问题.

遇到比较折腾点:构建二叉树时,把原本应该是(叶结点的有值的)节点放在了左节点,正确应该放在右节点,导致生成的编码序列不满足(任意编码不是其他编码的前缀).导致解码失败.

使用方法:

var srcData = Encoding.UTF8.GetBytes(textBox1.Text);
            var cpsData = Compress(srcData);
            treeView1.ExpandAll();
           var depData = DeCompress(cpsData);
            var depStr = Encoding.UTF8.GetString(depData );

这个TreeView就是显示二叉树的,要添加控件,或者删除代码.

快速理解:
1.此压缩直接对字节流进行压缩.
2.压缩原理:字节流对每个直接使用率不平均,所以用变长的编码对256个字节重新编码,以较短的编码表示使用率高的字节,较长编码表示使用率低的字节.
所以总体来看,用新的编码表示的字节流要比原来的短.(除非字节流特别小,压缩效果就不好)
3.由于二叉树的性质,将使用率低的先加入树,使用率高的后加入作为使用率低的节点的父节点的兄弟节点(因为有值的节点必须是叶结点).从最底下向上构建
二叉树.

 using System;

 using System.Collections.Generic;

 using System.ComponentModel;

 using System.Data;

 using System.Drawing;

 using System.Linq;

 using System.Text;

 using System.Windows.Forms;

 using System.IO;

 namespace 霍夫曼二叉树压缩

 {

     public partial class Form1 : Form

     {

         public Form1()

         {

             InitializeComponent();

             var s=GetCode();

            var b= GetByteByCode(s);

         }

         private void button1_Click(object sender, EventArgs e)

         {

             var srcData = Encoding.UTF8.GetBytes(textBox1.Text);

             var cpsData = Compress(srcData);

             treeView1.ExpandAll();

            var depData = DeCompress(cpsData);

             var depStr = Encoding.UTF8.GetString(depData );

         }

         Dictionary<int, string> dicCode = new Dictionary<int, string>();

         byte[] Compress(byte[] data)

         {

             Dictionary<byte, int> everyCount = new Dictionary<byte, int>();

             foreach (var d in data)

             {

                 if(everyCount.ContainsKey(d)==false )

                     everyCount.Add(d,);

                 everyCount[d]++;

             }

             var orderAscCounts = everyCount.OrderBy(a=>a.Value);

             Queue<Count> queCouts = new Queue<Count>();

             orderAscCounts.ToList().ForEach(d => {

                 queCouts.Enqueue(new Count { key=d.Key, count=d.Value });

             });

             BuildTree(ref queCouts);

             foreach (var a in BNode.nodes)

             {

                 var code = new string(GetCode(a).Reverse().ToArray());

                 dicCode.Add(a.key,code);

             }

             BNode root = BNode.nodes[];

             while(root.parent!=null){

                 root = root.parent;

             }

             CreateTreeView(root,treeView1.Nodes);

             string curCode = "";

             List<byte> outData = new List<byte>();

             foreach (var d in data)

             {

                 curCode += dicCode[d];

                 if (curCode.Length >= )

                 {

                     byte curBit = GetByteByCode(curCode.Substring(,));

                     outData.Add(curBit);

                     curCode = curCode.Length >  ? curCode.Substring(, curCode.Length - ) : "";

                 }

             }

             if (curCode != "")

             {

                 curCode = curCode.PadRight(,'');

                 byte curBit = GetByteByCode(curCode);

                 outData.Add(curBit);

             }

             return outData.ToArray();

         }

         byte[] DeCompress(byte[] data)

         {

             string codes = "";

             for (int i = ; i < data.Length - ;i++ )

             {

                 codes += GetCode(data[i]);

             }

             codes += GetCode(data[data.Length-]).TrimEnd('');

             var bdata = GetCode(codes);

             return bdata;

         }

         byte GetByteByCode(string curCode)

         {

             return Convert.ToByte(curCode, );

         }

         byte[] GetCode(string code)

         {

             List<byte> datas = new List<byte>();

             int pos = ;

             var orderDicCode=dicCode.OrderByDescending(a=>a.Value.Length);

             do{

                 int p=-;

                 foreach (var vCode in orderDicCode)

                 {

                      p = code.IndexOf(vCode.Value);

                     if (p == )

                     {

                         datas.Add((byte)vCode.Key);

                         code = code.Substring(vCode.Value.Length , code.Length-vCode.Value.Length );

                         break;

                     }

                 }

                 if (p == -)

                 {

                     throw new Exception("解压出错:发现未能识别的编码,编码表或数据已被破坏!");

                 }

             }while(code.Length>);

            /* for (int i = 1; pos + i < code.Length ; i++)

             {

                 var firstCode = code.Substring(pos, i);

                 var secondCode = code.Substring(pos, i + 1);

                 var first = dicCode.Where(a => a.Value == firstCode);

                 var second = dicCode.Where(a => a.Value == secondCode);

                 if (first.Count() > 0 && second.Count() == 0 ){

                     datas.Add( (byte)first.First().Key);

                     pos = pos+i;

                     i = 1;

                 }

                 else if (pos + i == code.Length - 1 && second.Count() > 0)

                     datas.Add(  (byte)second.First().Key );

             }*/

             return datas.ToArray();

         }

         string GetCode(byte b )

         {

             return Convert.ToString(b, ).PadLeft(, '');//Convert.ToString(b, 2) ;//:

         }

         string GetCode(BNode a)

         {

             if (a.parent!=null)

                 return (a.isLeft ? "" : "")+GetCode(a.parent);

             return  "" ;

         }

         BNode BuildTree(ref Queue<Count> queCouts )

         {

             var first = queCouts.Dequeue();

             var second = queCouts.Dequeue();

             var lft =first.node==null? new BNode {  key=first.key, count=first.count  } : first.node;

             var rgt = second.node == null ? new BNode { key = second.key, count = second.count } : second.node;

             if (rgt.key == -)

             {

                 var temp = lft;

                 lft = rgt;

                 rgt = temp;

             }

             var pnode = new BNode

             {

                 key = -, count = first.count + second.count

             };

             lft.isLeft = true;

             rgt.isLeft = false;

             pnode.left = lft;

             pnode.right = rgt;

             lft.parent = pnode;

             rgt.parent = pnode;

             if (lft.key != -)

                 BNode.nodes.Add(lft);

             if (rgt.key != -)

                 BNode.nodes.Add(rgt);

             if (queCouts.Count > ){

                  queCouts.Enqueue(new Count { count=pnode.count, key=pnode.key, node=pnode });

                 var orderQue = queCouts.OrderBy(q => q.count).ToList();

                 queCouts.Clear();

                 foreach (var a in orderQue)

                     queCouts.Enqueue(a);

                 return BuildTree(ref queCouts);

             }

             else

                 return pnode;

         }

         void CreateTreeView(BNode node , TreeNodeCollection tnc)

         {

             if (node == null) return;

             var newNode = tnc.Add((node.isLeft ? "" : "") + (node.key!=-?"-"+node.key + ":" + node.count:""));

             CreateTreeView(node.left,newNode.Nodes);

             CreateTreeView(node.right, newNode.Nodes);

         }

         class Count

         {

            public int key;

            public int count;

            public BNode node;

         }

         class BNode{

             public int key;

             public int count;

             public BNode left;

             public BNode right;

             public BNode parent;

             public bool isLeft = false;

             public static List<BNode> nodes = new List< BNode>();

         }

     }

 }

C# 霍夫曼二叉树压缩算法实现的更多相关文章

赫夫曼\哈夫曼\霍夫曼编码 (Huffman Tree)
哈夫曼树给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离 ...
word2vec 中的数学原理二预备知识霍夫曼树
主要参考: word2vec 中的数学原理详解自己动手写 word2vec 编码的话,根是不记录在编码中的这一篇主要讲的就是霍夫曼树(最优二叉树)和编码. ...
霍夫曼编码（Huffman Coding）
霍夫曼编码(Huffman Coding)是一种编码方法,霍夫曼编码是可变字长编码(VLC)的一种. 霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符 ...
CF 463A && 463B 贪心 && 463C 霍夫曼树 && 463D 树形dp && 463E 线段树
http://codeforces.com/contest/462 A:Appleman and Easy Task 要求是否全部的字符都挨着偶数个'o' #include <cstdio> ...
word2vec中关于霍夫曼树的
再谈word2vec 标签: word2vec自然语言处理NLP深度学习语言模型 2014-05-28 17:17 16937人阅读评论(7) 收藏举报分类: Felven在职场(86) ...
Alink漫谈(十六) ：Word2Vec源码分析之建立霍夫曼树
Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树目录 Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树 0x00 摘要 0x01 背景概念 1.1 词向量基础 ...
Java数据结构（十二）—— 霍夫曼树及霍夫曼编码
霍夫曼树基本介绍和创建基本介绍又称哈夫曼树,赫夫曼树给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树霍夫曼树是带权路径长度最短的树,权值较 ...
基于python的二元霍夫曼编码译码详细设计
一.设计题目对一幅BMP格式的灰度图像(个人证件照片)进行二元霍夫曼编码和译码二.算法设计 (1)二元霍夫曼编码: ①:图像灰度处理: 利用python的PIL自带的灰度图像转换函数,首先将彩色图 ...
采用霍夫曼编码(Huffman)画出字符串各字符编码的过程并求出各字符编码 --多媒体技术与应用
题目:有一个字符串:cabcedeacacdeddaaaba,问题: (1)采用霍夫曼编码画出编码的过程,并写出各字符的编码 (2)根据求得的编码,求得各编码需要的总位数 (3)求出整个字符串总编码长 ...

随机推荐

Git 忽略已经提交的文件
如果想在本地忽略某个文件的话执行这个命令: git update-index --assume-unchanged <file> 如果想重新同步这个文件的话执行这个命令. git upda ...
keil 工程中多文件编译时全局变量怎么引用
由于代码较多时,为了代码的工整以及易读性,往往将代码拆分成模块,并书写头文件.但keil中定义全局变量往往是一件头疼的事情. (1)xx.h文件中基本书写的是管脚定义和函数声明,全局变量不能定义在头文 ...
c++重载、覆盖和隐藏
看以前的:http://www.cnblogs.com/youxin/p/3305688.html 答案:a.成员函数被重载的特征:overload(1)相同的范围(在同一个类中):(2)函数名字相同 ...
Oracle RAC学习笔记:基本概念及入门
Oracle RAC学习笔记:基本概念及入门 2010年04月19日 10:39 来源:书童的博客作者:书童编辑:晓熊 [技术开发技术文章] oracle 10g real applica ...
Coach（并查集）
Description A programming coach has n students to teach. We know that n is divisible by 3. Let's ass ...
【转】MFC下拉列表框的用法
原文网址:http://blog.csdn.net/kinglimy/article/details/6452239 Combo Box (组合框)控件很简单,可以节省空间.从用户角度来看,这个控件是 ...
HDFS Block Replica Placement实现原理
1. 背景 Block Replica Placement——数据块复本存储策略,HDFS Namenode以此为依据选取数据块复本应存储至哪些HDFS Datanodes,策略的设计需要权衡以下 ...
HDU 5933 ArcSoft's Office Rearrangement 【模拟】(2016年中国大学生程序设计竞赛（杭州）)
ArcSoft's Office Rearrangement Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K ...
全面理解Java异常的运行机制
1. 引子 try…catch…finally恐怕是大家再熟悉不过的语句了,而且感觉用起来也是很简单,逻辑上似乎也是很容易理解.不过,我亲自体验的“教训”告诉我,这个东西可不是想象中的那么简单.听话. ...
Ural 1046 Geometrical Dreams（解方程+计算几何）
题目链接:http://acm.timus.ru/problem.aspx?space=1&num=1046 参考博客:http://hi.baidu.com/cloudygoose/item ...

C# 霍夫曼二叉树压缩算法实现

C# 霍夫曼二叉树压缩算法实现的更多相关文章

随机推荐

热门专题