//first thing:thanks to my teacher---chenrong      Dalian Maritime university

/*

构造Huffman Tree思路:
(1)根据给点的n个权值{w1,w2,w3.....wn}构成n棵二叉树的集合F={T1,T2,T3......Tn},其中每棵二叉树只有个带有权值Wi的根节点,其左右子树为空。
(2)在F中选取两棵根结点的权值最小的树作为左右子树构造一个新二叉树,新根权值为左右子树权值之和。
(3)在F中delete掉这两棵树,插入新二叉树到F中。
(4)重复(2)和(3),直到F中只含一棵树,此树为Huffman Tree。
 
 
网络查找到英文字母使用频率如下:
E是使用频率最高的,下面是英文字母使用频率表:(%)
A 8.19   B 1.47   C 3.83   D 3.91   E 12.25
F 2.26   G 1.71   H 4.57   I 7.10   J 0.14
K 0.41   L 3.77   M 3.34   N 7.06   O 7.26
P 2.89   Q 0.09   R 6.85   S 6.36   T 9.41
U 2.58   V 1.09   W 1.59   X 0.21   Y 1.58   Z 0.08
 
*/
 
#include
#define n 29     //叶子数目(设计为适用26个英文字母加空格逗号点号的叶子节点数)
#define m (2*n-1)    //结点总数
#define maxval 10000.0     //maxval是float类型数据的最大值
#define maxsize 100   //哈夫曼编码的最大位数
typedef struct
{
 char ch;            //记录叶子节点的指代字符
 float weight;       //权值(记录该叶子节点的使用频率或频数)
 int lchild,rchild,parent;       //左右孩子和双亲节点
}hufmtree;
typedef struct
{
 char bits[n];   //哈夫曼编码串[位串]
 int start;      //编码在位串中的起始位置
 char ch;        //字符(当前叶子节点指代字符)
}codetype;
 
void huffman(hufmtree tree[]);//建立哈夫曼树
void huffmancode(codetype code[],hufmtree tree[]);//根据哈夫曼树求出哈夫曼编码
void decode(hufmtree tree[]);//依次读入二进制电文,根据哈夫曼树译码为字符
void character(codetype code[]);//依次读入字符,根据哈夫曼树编码二进制电文
 
void main()
{
 printf("                 >>>>>Huffman树进行电文译码与编码<<<<<\n\n");
 printf("                            -----本转换程序仅适用于电文总共使用 %d 个字符的编码\n",n);
 printf("                                 所有输入文本都以'2'为输入结尾标识,用于判读结束\n");
 hufmtree tree[m]; //使用结构体数组存储Huffman树(森林)
 codetype code[n];
 int i,j;//循环变量
 huffman(tree);//建立哈夫曼树
 huffmancode(code,tree);//根据哈夫曼树求出哈夫曼编码
 printf("\n                     >>每个字符的哈夫曼编码如下<<\n");
 for(i=0;i<n;i++)
 {
  printf("%c: ",code[i].ch);//输出叶子结点指代字符
  for(j=code[i].start;j<n;j++)
   printf("%c ",code[i].bits[j]);//输出求得的哈夫曼编码
  printf("\n");
 }
 
 int Lbool=1;
 int temp;
 while (Lbool)
 {
      printf("\n-------------------------功能选项卡------------------------\n");
      printf("1、自然语言文本转码;\t2、Huffman数串译码;\t3、退出系统;\n\n");
      scanf("%d",&temp);
      getchar();
      switch (temp)
      {
          case 1:
              printf("                      >>自然语言文本转码区<<\n");
              character(code);    //依次读入自然语言文本电文,根据哈夫曼树转码
              break;
          case 2:
              printf("\n                  >>Huffman编码电文译码为自然语言区<<\n\n");
              decode(tree);//依次读入二进制数电文,根据哈夫曼树译码(为人易读的自然语言)
              break;
          case 3:
              Lbool=0;
              break;
          default:
              break;
      }
 }
}
 
void huffman(hufmtree tree[])//建立哈夫曼树
{
 int i,j,p1,p2;//p1,p2用于分别记住每次合并时权值最小和次小的两个根结点的下标
 float small1,small2,f;   //f用于接收键盘输入的权值
 char c;
 for(i=0;i<m;i++)    //初始化二叉树集合(只有两个叶子结点的森林)
 {
  tree[i].parent=0;   //此时节点是根结点,在合并前都设为0(在建立哈夫曼树时选择parent为0且weight最小的两个结点分编序号)
  tree[i].lchild=-1;
  tree[i].rchild=-1;  //左右孩纸结点设为-1
  tree[i].weight=0.0; //权值置零
 }
 printf("\n                       >>电文使用的各字符编码区<<\n\n");
 for(i=0;i<n;i++)  //读入前n个结点的字符及权值
 {
  printf("第%2d个字符和对应权值(空格分隔):",i+1);
  scanf("%c %f",&c,&f);
  getchar();
  tree[i].ch=c;
  tree[i].weight=f;    //对二叉树集合(森林)中每一棵树赋值,记录下字符与权值
 }
 for(i=n;i<m;i++)      //进行n-1次合并,产生n-1个新结点[m-n=(2*n-1-n)=n-1]
 {
  p1=0;p2=0;  //每次合并时都要初始化记录权值最小和次小的两个根结点下标的变量p1,p2,因为每次合并后集合中权值情况都改变了,合并后可能不再是最小权值
  small1=maxval;small2=maxval;   //maxval是float类型的最大值.small1记录最小权值,small2记录次小权值
 
  for(j=0;j<i;j++)    //选出两个权值最小的根结点
   if(tree[j].parent==0)   //(选择parent为0且weight最小的两个结点分编序号,用p1,p2记录)
    if(tree[j].weight<small1)
    {
     small2=small1;  //改变最小权值、次小权值,最小权值赋给small1,次小权值给small2
     small1=tree[j].weight;
     p2=p1;          //改变次小权值对应的位置,记录次小权值结点下标
     p1=j;           //改变最小权值对应的位置,记录最小权值结点下标
    }
    else
     if(tree[j].weight<small2)
     {
      small2=tree[j].weight;  //改变次小权值及位置,原small1<tree[j].weight<原small2,作为次小权值赋给small2
      p2=j;         //改变次小权值对应的位置,记录次小权值结点下标
     }
  tree[p1].parent=i;
  tree[p2].parent=i;  //合并最小权值与次小权值二叉树,(因为是结构体数组,将结构体成员中双亲结点赋值为i即可,便是新的第i个结点了)
  tree[i].lchild=p1;  //最小权根结点是新结点的左孩子
  tree[i].rchild=p2;  //次小权根结点是新结点的右孩子
  tree[i].weight=tree[p1].weight+tree[p2].weight;  //新节点的权值是左右孩纸的权值之和(合并前两个最小权值与次小权值二叉树权值之和)
 }
}//huffman
 
void huffmancode(codetype code[],hufmtree tree[])//根据哈夫曼树求出哈夫曼编码
//codetype code[]为求出的哈夫曼编码
//hufmtree tree[]为已知的哈夫曼树
{
 int i,c,p;
 codetype cd;   //中间变量(缓冲变量)
 for(i=0;i<n;i++)
 {
  cd.start=n;
  cd.ch=tree[i].ch;
  c=i;       //从叶结点出发向上回溯(从叶子到根逆向求每个字符的哈夫曼编码)
  p=tree[i].parent;  //tree[p]是tree[i]的双亲(parent记录了隶属关系,左右孩子[实际上是两个独立的结构体数据]在tree数组中的下标之和记录在parent中)
  while(p!=0)       //左小为'0',右大为'1'.用bits[]数组存贮编码后得到的二进制串
  {
   cd.start--;      //每次都是从头码开始逐位逐位地形成编码位串
   if(tree[p].lchild==c)      //判断是否是双亲结点的左孩子
    cd.bits[cd.start]='0';   //tree[i]是左子树,生成代码'0'
   else
    cd.bits[cd.start]='1';   //tree[i]是右子树,生成代码'1'
   c=p;                      //进入上一层节点
   p=tree[p].parent;         //记住当前节点的双亲节点在数组中的位置,便于下一次用于判断当前节点是双亲节点的哪一个孩纸
  }
  code[i]=cd;    //第i+1个字符的编码存入code[i].(解释:cd数据类型的第一个成员变量是bits[]数组,用cd作数组的首地址)
 }
}//huffmancode
 
void decode(hufmtree tree[])//依次读入电文,根据哈夫曼树译码
{
 int i,j=0;
 char b[maxsize];
 char endflag='2';    //电文结束标志取2
 i=m-1;             //从根结点开始往下搜索
 printf("Huffman编码文本录入:\n");
 gets(b);
 printf("\n                       >>译码后的文本信息<<\n\n");
 while(b[j]!='2')
 {
  if(b[j]=='0')
   i=tree[i].lchild;   //走向左孩子
  else
   i=tree[i].rchild;   //走向右孩子
  if(tree[i].lchild==-1)     //tree[i]是叶子结点
  {
   printf("%c",tree[i].ch);
   i=m-1;      //回到根结点
  }
  j++;
 }
 printf("\n\n<><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><>");
 if(tree[i].lchild!=-1&&b[j]!='2')   //二进制电文读完,但尚未到叶子结点
  printf("\nInput Information Is Error!\n");  //输入电文有错
}//decode
 
 
void character(codetype code[])   //自然语言转码成Huffman编码
{
    int i=0,j,k=0;
    char b[maxsize];          //自然语言电文的接受
    printf("自然语言文本录入:\n");
    gets(b);
    printf("                      >>转码后的文本信息显示区<<\n\n");
    while (b[k]!='2')
    {
        for(i=0;i<n;i++)
        {
            if(b[k]==code[i].ch)         //code已经记录下所有的字符信息,这个时候拿来用还是很方便的O(∩_∩)O哈!
           {
            for(j=code[i].start;j<n;j++)
            printf("%c",code[i].bits[j]);//输出对应的哈夫曼编码
           }
        }
        k++;
    }
    printf("\n");
}

//运行效果图

 
 

Huffman编码实现电文的转码与译码的更多相关文章

  1. Huffman编码实验

    一. 实验目的 熟练掌握哈夫曼树的建立和哈夫曼编码的算法实现. 二. 实验内容 根据哈夫曼编码的原理,编写一个程序,在用户输入结点权值的基础上求赫夫曼编码,并能把给定的编码进行译码. 三. 实验要求 ...

  2. [老文章搬家] 关于 Huffman 编码

    按:去年接手一个项目,涉及到一个一个叫做Mxpeg的非主流视频编码格式,编解码器是厂商以源代码形式提供的,但是可能代码写的不算健壮,以至于我们tcp直连设备很正常,但是经过一个UDP数据分发服务器之后 ...

  3. 【数据压缩】Huffman编码

    1. 压缩编码概述 数据压缩在日常生活极为常见,平常所用到jpg.mp3均采用数据压缩(采用Huffman编码)以减少占用空间.编码\(C\)是指从字符空间\(A\)到码字表\(X\)的映射.数据压缩 ...

  4. Jcompress: 一款基于huffman编码和最小堆的压缩、解压缩小程序

    前言 最近基于huffman编码和最小堆排序算法实现了一个压缩.解压缩的小程序.其源代码已经上传到github上面: Jcompress下载地址 .在本人的github上面有一个叫Utility的re ...

  5. DS二叉树--Huffman编码与解码

    题目描述 1.问题描述 给定n个字符及其对应的权值,构造Huffman树,并进行huffman编码和译(解)码. 构造Huffman树时,要求左子树根的权值小于.等于右子树根的权值. 进行Huffma ...

  6. Huffman 编码压缩算法

    前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法.相信大家应该听说过 David Huffman 和他的压缩算法—— Huffman Code,一种通过字 ...

  7. [转载]Huffman编码压缩算法

    转自http://coolshell.cn/articles/7459.html 前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法.相信大家应该听说过 D ...

  8. Huffman编码实现文件的压缩与解压缩。

    以前没事的时候写的,c++写的,原理很简单,代码如下: #include <cstdio> #include <cstdlib> #include <iostream&g ...

  9. Huffman编码

    #define _CRT_SECURE_NO_WARNINGS #include <iostream> #include <cstdio> #include <cstri ...

随机推荐

  1. GUID是什么意思及Guid在sqlserver中的使用

    GUID(全球唯一标识)是微软使用的一个术语,由一个特定的算法,给某一个实体,如Word文档,创建一个唯一的标识,GUID值就是这个唯一的标识码.GUID广泛应用于微软的产品中,用于识别接口.复制品. ...

  2. 浅谈angular框架

    最近新接触了一个js框架angular,这个框架有着诸多特性,最为核心的是:MVVM.模块化.自动化双向数据绑定.语义化标签.依赖注入,以上这些全部都是属于angular特性,虽然说它的功能十分的强大 ...

  3. jq 图片上传

    1.html <input type="file" class="ImgInput" name="ImgInput"/> 2.j ...

  4. [Client]动检参数讨论与ONVIF

    [问题]客户端访问ONVIF设备动检 客户端要访问ONVIF设备(IPC)的动检,一是事件,二是设置: 此处就是讨论如何设置动检区域的. 通过Video Analytics/Cell Motion D ...

  5. placeholder调整颜色

    placeholder需要设定以下样式: ::-webkit-input-placeholder { /* WebKit browsers */ color: #999; } :-moz-placeh ...

  6. jQuery--引入,基本语法,以及常用事件

    一.初识jQuery jQuery是一个JavaScript函数库.主要包含的功能有:HTML元素的选取.操作,CSS操作,HTML事件函数,JavaScript特效和动画,HTML DOM遍历和修改 ...

  7. dedecms自定义表单提交成功如何返回当前页面

    在plus/diy.php找到showmsg($bkmsg, $goto);改成showmsg($bkmsg, -1);

  8. 转:PHP的线程安全ZTS与非线程(NTS)安全版本的区别

    原文来自于:http://blog.sina.com.cn/s/blog_94c21e8f0101s2ic.html Windows版的PHP从版本5.2.1开始有Thread Safe(线程安全)和 ...

  9. 【Winform 控件浅谈 】 之 WebBrowser

    前言 鄙人才疏学浅,如果说错了,还请各位不吝赐教 1.什么是 WebBrowser 下面是已有的轮子,我想说它们是专业的 http://baike.baidu.com/view/2981935.htm ...

  10. couchdb and redis

    http://www.jdon.com/artichect/scalable5.html http://www.dedecms.com/knowledge/data-base/nosql/2012/0 ...