以前没事的时候写的,c++写的,原理很简单,代码如下:

 #include <cstdio>
#include <cstdlib>
#include <iostream>
#include <string>
//#include <bitset>
#include <fstream>
#include <ctime> const int maxCodeNum = ; using namespace std; //哈夫曼树的树节点
struct HaffTreeNode{
HaffTreeNode * lNode;
HaffTreeNode * rNode;
string haffCode;
int value;
int alpha;
HaffTreeNode()
:lNode(NULL), rNode(NULL), haffCode(""), value(), alpha(){;}
}; //链表节点,用于生成哈夫曼树
struct ListNode{
struct HaffTreeNode HaffTreeNode;
ListNode *nextListNode;
ListNode()
:nextListNode(NULL){;}
}; //用与保存输入文件统计信息的hash表
typedef struct HashTable{
int value;
int alpha;
HashTable()
:value(), alpha(){}
//比较函数用于排序使用
inline friend int operator-(const HashTable & a, const HashTable & b){
return a.value - b.value;
}
} HashTable;
HashTable charHashTable[maxCodeNum]; //排序使用的比较大小的函数
int hashComp(const void * a, const void * b)
{
return *((HashTable *)a) - *((HashTable *)b);
} //创建一个哈夫曼树
HaffTreeNode * createHaffTreeNodeTree(HashTable table[])
{
ListNode *root = new ListNode;
ListNode *next = root;
for(int i = ; /*i < maxCodeNum - 1*/; ++i){
if(table[i].value == )//如果对应的码不为0,就为其分配一个树节点
continue;
next->HaffTreeNode.alpha = table[i].alpha;
next->HaffTreeNode.value = table[i].value;
if(i ==maxCodeNum - )
break;
next->nextListNode = new ListNode;
next = next->nextListNode;
} while(root->nextListNode != NULL){
ListNode * currNode = new ListNode;
currNode->HaffTreeNode.value = root->HaffTreeNode.value + root->nextListNode->HaffTreeNode.value;
currNode->HaffTreeNode.lNode = &(root->HaffTreeNode);
currNode->HaffTreeNode.rNode = &(root->nextListNode->HaffTreeNode);
root = root->nextListNode->nextListNode; //概率最小的两个码相加组成一个新的节点 ListNode * nextNode = root;
ListNode * prevNode = NULL;
while(nextNode != NULL && currNode->HaffTreeNode.value > nextNode->HaffTreeNode.value){
prevNode = nextNode;
nextNode = nextNode->nextListNode;
} if(prevNode == NULL){//将这个新的节点插入到所有节点之前(currNode目前还是最小的)
currNode->nextListNode = nextNode;
root = currNode;
}else{//插入到节点中间或者节点之后的位置
prevNode->nextListNode = currNode;
currNode->nextListNode = nextNode;
}
}//在这个list中所有的元素遍历完成之后返回
return &(root->HaffTreeNode);//返回书的根节点的哈弗满节点,这个节点已经构造成为了一棵树
} string huffmanCodeTable[maxCodeNum];
string haffCode; //给哈夫曼树编码
void createHaffmanTable(HaffTreeNode * root)
{
if(root->lNode == NULL && root->rNode == NULL){
huffmanCodeTable[root->alpha] = haffCode;
haffCode.erase(haffCode.length() - );
return;
}//给各个节点赋予相应的哈夫曼编码
haffCode.append("");
createHaffmanTable(root->lNode); haffCode.append("");
createHaffmanTable(root->rNode); if(!haffCode.empty()){
haffCode.erase(haffCode.length() - );
}
return;
} //将生成的二进制长串编码转换成字符用于存储在压缩文件中
unsigned char StrToBin(string str)
{
unsigned int ans =;
int tmpNum = atoi(str.c_str());
int multiNum = ;
while(tmpNum != ){
ans += tmpNum%*multiNum;
tmpNum/=;
multiNum *= ;
}
return (unsigned char) ans;
} //用于将压缩文件的字符转换成huffman编码
string BinToStr(unsigned char c)
{
string tmpNumStr;
while(c != ){
tmpNumStr.insert(tmpNumStr.begin(), (unsigned char)(c% + ''));
c /= ;
}
if(tmpNumStr.length() < ){
tmpNumStr.insert(tmpNumStr.begin(), - tmpNumStr.length(), '');
}
return tmpNumStr;
} //下面是将huffman码译成原字符的程序
char huffDecode(HaffTreeNode * root, string & code)
{
unsigned int i;
for( i = ; i < code.length(); ++i){
if(root->alpha == )
root = (code[i] - '')?root->rNode:root->lNode;
else{
code.erase(, i);
return root->alpha;
}
}
if(root->alpha !=){
code.erase(, i);
return root->alpha;
}
code.clear();
return '\0';
} int main(int argc, char ** argv)
{
if(argc != ){
printf("Error number of arguments!\n");
}
FILE * fin = fopen(argv[], "r");
int c = ;
while((c = fgetc(fin)) != EOF && c != '\n'){
putchar(c);
putchar('*');
charHashTable[c].alpha = c;
charHashTable[c].value++;
} qsort(charHashTable, sizeof(charHashTable)/sizeof(charHashTable[]),
sizeof(charHashTable[]), hashComp);
/*建立有关本文件的huffman树*/
HaffTreeNode * haffTreeRoot = createHaffTreeNodeTree(charHashTable);
createHaffmanTable(haffTreeRoot); cout << "Char\tTimes\tCodes";
for(int i = ; i < maxCodeNum; ++i){
if(charHashTable[i].value != ){
cout << (char)charHashTable[i].alpha << "\t" << charHashTable[i].value
<< "\t" << huffmanCodeTable[charHashTable[i].alpha] << "\n";
}
} FILE * fout;
if((fout = fopen(argv[], "w")) == NULL){
perror("open output file error!\n");
}
rewind(fin);
string buf; while((c = fgetc(fin)) != EOF){ /*将文件通过huffman码转来进行压缩*/
//printf("The char is %c ", c);
buf += huffmanCodeTable[c];
cout << buf << endl;
if(buf.length() > ){ //当转换的字符得到的huffman码达到8的时候转换成一个字符填入目标文件
fputc(StrToBin(buf.substr(, )), fout);
buf.erase(, );
}
} int leftZero = ; //保存不到8位的余留位的个数
if(!buf.empty()){
buf.append((leftZero = - buf.length()), '');
fputc(StrToBin(buf), fout);
} if(fclose(fin) == -)
perror("close file error!\n");
if(fclose(fout) == -)
perror("close file error!\n"); if((fin = fopen(argv[], "rb")) == NULL)//打开压缩文件,开始解码
perror("Open file error!\n");
if((fout = fopen("huffmanDecompose.txt", "w")) == NULL)
perror("Open file error!\n"); //开始解码
int bin;
buf.clear();
while((bin = fgetc(fin)) != EOF){
buf.append(BinToStr(bin));
} while(buf.length() - leftZero != && !buf.empty()){
fputc(huffDecode(haffTreeRoot, buf), fout);
}
if(fclose(fin) != )
perror("close file error!\n");
if(fclose(fout) != )
perror("close file error!\n");
return ;
}

./a.out file1 file2
file1:输入文件
file2:输出文件(压缩后)
要锁完成后会将文压缩文件解压到huffmanDecompose.txt这个文件中

Huffman编码实现文件的压缩与解压缩。的更多相关文章

  1. C# 下利用ICSharpCode.SharpZipLib.dll实现文件/目录压缩、解压缩

    ICSharpCode.SharpZipLib.dll下载地址 1.压缩某个指定文件夹下日志,将日志压缩到CompressionDirectory文件夹中,并清除原来未压缩日志. #region 压缩 ...

  2. Linux之文件的压缩与解压缩

    压缩格式 .zip,.rar,.7z,.tar,.gz,.xz,.bz2,.tar.gz,.tar.xz,.tar.bz2,其中,形如*.tar.gz为tar打包,gz压缩的文件 zip压缩打包程序 ...

  3. Linux文件打包压缩、解压缩、备份命令使用方法(转载)

    对于刚刚接触Linux的人来说,一定会给Linux下一大堆各式各样的文件名给搞晕.别个不说,单单就压缩文件为例,我们知道在Windows下最常见的压缩文件就只有两种,一是,zip,另一个是.rar.可 ...

  4. java实现单个或多个文件的压缩、解压缩 支持zip、rar等格式

    代码如下: package com.cn.util; import java.io.BufferedInputStream; import java.io.File; import java.io.F ...

  5. Linux下文件的压缩与解压缩

    一.zip格式 zip可能是目前使用的最多的文档压缩格式.它最大的优点就是在不同的操作系统平台上使用.缺点就是支持 的压缩率不是很高,而tar.gz和tar.bz2在压缩率方面做得非常好. 我们可以使 ...

  6. C# 文件/文件夹压缩解压缩

    项目上用到的,随手做个记录,哈哈. 直接上代码: using System; using System.Data; using System.Configuration; using System.C ...

  7. Linux下文件的压缩与打包

    一.Linux下常见的文件压缩命令: 在Linux的环境中,压缩文件的扩展名大多是:『*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2』,为什么会有这样的扩展名呢? 这 ...

  8. C#压缩文件,C#压缩文件夹,C#获取文件

    using System; using System.Data; using System.Configuration; using System.Collections.Generic; using ...

  9. Jcompress: 一款基于huffman编码和最小堆的压缩、解压缩小程序

    前言 最近基于huffman编码和最小堆排序算法实现了一个压缩.解压缩的小程序.其源代码已经上传到github上面: Jcompress下载地址 .在本人的github上面有一个叫Utility的re ...

随机推荐

  1. 访问hdfs里的文件

    准备工作: 给hdfs里上传一份用于测试的文件 [root@master ~]# cat hello.txt hello 1 hello 2 hello 3 hello 4 [root@master ...

  2. Git学习笔记-精简版

    注意本文参考廖雪博客: http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000 一:Git ...

  3. go——并发(二)

    通常程序会被编写为一个顺序执行并完成一个独立任务的代码. 如果没有特别的需求,最好总是这样写代码,因为这种类型的程序通常很容易写,也容易维护. 不过也有一些情况下,并行执行多个任务会有更大的好处. 一 ...

  4. mysql第二天作业

    create database 数据库名 default charset utf8;use 数据库名;1.创建成绩表,字段包括:学生姓名,语文成绩,数学成绩,英语成绩create table resu ...

  5. LeetCode:二叉树的后序遍历【145】

    LeetCode:二叉树的后序遍历[145] 题目描述 给定一个二叉树,返回它的 后序 遍历. 示例: 输入: [1,null,2,3] 1 \ 2 / 3 输出: [3,2,1] 进阶: 递归算法很 ...

  6. PHP 留言板练习

    登录页面同session一样 login页面 <form action="loginchuli.php" method="post"> <di ...

  7. 『NiFi 学习之路』入门 —— 下载、安装与简单使用

    一.概述 "光说不练假把式." 官网上的介绍多少让人迷迷糊糊的,各种高大上的词语仿佛让 NiFi 离我们越来越远. 实践是最好的老师.那就让我们试用一下 NiFi 吧! 二.安装 ...

  8. J.U.C之AQS

    AQS是J.U.C的核心 AQS(AbstractQueuedSynchronizer)队列同步器,AQS是JDK下提供的一套用于实现基于FIFO等待队列的阻塞锁和相关的同步器的一个同步框架. 同步器 ...

  9. Django学习笔记之模板渲染、模板语言、simple_tag、母版子版、静态配置文件

    一.首先我们用PyCharm来创建一个Django项目 终端命令:django-admin startproject sitename 图形创建:   这样一个Django项目就创建完成了,上面可以看 ...

  10. Python3:读取配置dbconfig.ini(含有中文)显示乱码的解决方法

    Python3:读取配置dbconfig.ini(含有中文)显示乱码的解决方法 一.原因 Python 3 中虽有encoding 参数,但是对于有BOM(如Windows下用记事本指定为utf-8) ...