超级简单的数据压缩算法—LZW算法
1. 前文回顾
在字符串算法—数据压缩中,我们介绍了哈夫曼压缩算法(Huffman compression),本文将介绍LZW算法。
2. LZW算法
这个算法很简单,为了方便讲述,我们将采用16进制,写代码的时候在把它转回2进制就是了。
在16进制下:A:41; B:42; C:43; D:44;......
从例子入手:

压缩表是边读数据边建立起来的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。
首先从第一个数据开始读:
第一个字符为A, A在压缩表里已存在,值是41;

下一个字符为B,B在压缩表里已存在,值是42;
前一个字符A与这个字符B结合成AB,给它一个值:81;(为什么是81?因为41~79都被字母用了)
把AB加到压缩表里:

下一个字符为R,R在压缩表里已存在,值是52;
前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

下一个字符为A,A在压缩表里已存在,值是41;
前一个字符R与这个字符A结合成RA,给它一个值:83,加到压缩表中:
如此类推,一直到D那里:

下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的AB也在压缩表里,我们取含字符最多的AB:
前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

下一个字符为R, R在压缩表里已存在,但下下一个字符为A,它们两组合而成的RA也在压缩表里,我们取含字符最多的RA;
前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

下一个字符为B, B在压缩表里已存在,但下下一个字符为R,它们两组合而成的BR也在压缩表里,我们取含字符最多的BR;
前一个字符串RA与这个字符串的首字符B结合成RAB,给它一个值:89,加到压缩表中:

下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的BR也在压缩表里; 但下下下一个字符为R,它们三组合而成的ABR也在压缩表里,我们取含字符最多的ABR;
前一个字符串BR与这个字符串的首字符A结合成BRA,给它一个值:8A,加到压缩表中:

下一个字符为A, A在压缩表里已存在,值为41;
前一个字符串BRA与这个字符A结合成ABRA,给它一个值:8B,加到压缩表中:

下一个字符为空,说明数据已经压缩完了,给个值80作为终止标记:

压缩后的数据就是上述的值的组合,压缩表直接删除。
压缩后的数据S:41425241434144818382884180。
压缩的方法讲完了,那么如何解压呢?
我们也是边解压边建表:
现有压缩数据S:41425241434144818382884180。

同样的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。
首先从第一个数据开始读:
第一个值为41,对应字符A:

下一个数据为42,对应字符B;
前一个字符A与这个字符B结合成AB,给它一个值:81,加到压缩表中:

下一个数据为52,对应字符R;
前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

如此类推,一直读到81:

下一个数据为81,对应字符串AB;
前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

下一个数据为83,对应字符串RA;
前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

如此类推,一直读到80:

下一个数据为80,这是压缩的终止值,说明解压完成了,此时,把压缩表丢掉。
解压后得到原数据S:ABRACADABRABRABRA;
由于我们的压缩表都是动态生成的,我们省了保存它的时间和空间。
解压和压缩都介绍完了,这个算法也就结束了,超级简单!
有时候解压时,会遇到些有趣的情形,如下图:
原数据压缩:

解压时:

下一个数据为81,对应字符串AB;
前一个字符B与这个字符串的首字符A结合成BA,给它一个值:82,加到压缩表中:

下一个数据为83,嗯?83?83不在压缩表里啊,去哪找83?
容我们冷静分析一波:
首先,压缩表去到了82,下一个数据就是83。因为是83,所以肯定是个字符串。(81以上都是我们自己加的字符串!)
假设83对应的字符串为X:

前一个字符串AB与这个字符串的首字符X1(假设X是由X1X2X3...XN组成)结合成ABX1,给它一个值:83,加到压缩表中:

即X=ABX1, X1是X的首字符(ABX1的首字符),即X1=A;
故得知X=ABA:

下一个数据是80,解压完成。解压后的原数据为ABABABA;
至此,LZW算法介绍完毕。
实现代码:

超级简单的数据压缩算法—LZW算法的更多相关文章
- 数据压缩算法---LZ77算法 的分析与实现
LZ77简介 Ziv和Lempel于1977年发表题为“顺序数据压缩的一个通用算法(A Universal Algorithm for Sequential Data Compression )”的论 ...
- 【Java/Android性能优 4】PreloadDataCache支持预取的数据缓存,使用简单,支持多种缓存算法,支持不同网络类型,扩展性强
本文转自:http://www.trinea.cn/android/preloaddatacache/ 本文主要介绍一个支持自动向前或向后获取新数据的缓存的使用及功能.Android图片内存缓存可见I ...
- 【数据压缩】LZW算法原理与源代码解析
转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/50331883 <勿在浮沙筑高台> LZW压缩算法原理很easy,因 ...
- LZW算法PHP实现方法 lzw_decompress php
LZW算法PHP实现方法 lzw_decompress php 博客分类: Php / Pear / Mysql / Node.js LZW算法简介 字符串和编码的对应关系是在压缩过程中动态生成的 ...
- zw版_Halcon图像交换、数据格式、以及超级简单实用的DIY全内存计算.TXT
zw版_Halcon图像交换.数据格式.以及超级简单实用的DIY全内存计算.TXT Halcon由于效率和其他原因,内部图像采用了很多自有格式,提高运行速度,但在数据交换方面非常麻烦. 特别是基于co ...
- phpexcelreader超级简单使用
phpexcelreader超级简单使用 该php类可以到官网下载:http://www.codeplex.com/PHPExcel,下载的文件不能直接使用要看下面的备注. 备注: 1.要将olere ...
- 哈,又一款超级简单的队列(MQ)实现方案来了~
开源的消息队列已经很多了,但大部分很重,实际环境下,很多可能只是使用到了一点功能而已,杀鸡使用牛刀,着实有些浪费了.很多时候,我们只想要一片绿叶,但它们给了我们整个的春天,很难消化.本着DIR精神, ...
- html超级简单实现点赞(收藏)和取消赞效果
1.前言 我们经常会遇到对一些列表呀进行点赞呀收藏数据等效果呀.今天就用html+css实现超级简单易上手的点赞和取消赞的demo展示. 2.详情 1.css样式 .like{ font-size:6 ...
- 图像数据到网格数据-1——MarchingCubes算法
原文:http://blog.csdn.net/u013339596/article/details/19167907 概述 之前的博文已经完整的介绍了三维图像数据和三角形网格数据.在实际应用中,利用 ...
随机推荐
- onclick 事件
onclick 事件 Event 对象 定义和用法 onclick 事件会在对象被点击时发生. 请注意, onclick 与 onmousedown 不同.单击事件是在同一元素上发生了鼠标按下事件之后 ...
- HDU4745--区间DP+回文串
这题的题意为,给你一个环状的字符串,有两只兔子分别从某任意的石头上开始跳跃.一只顺时针跳.一只逆时针跳.两只兔子每一次落脚处石头的质量都相同.兔子要一步一步的跳,且不能跳到之前跳到过的地方.总的来说, ...
- U3D外包团队:五款IDE推荐!
1. Jetbrains RubyMine RubyMine是由捷克Jetbrains公司开发的,目前可提供使用的版本有RubyMine 5.4.而且RubyMine 5.4同时也为Rails 4的发 ...
- 浅了解:react为何需要设定唯一key值(antd-table)
一.React规范 1.1 react key的作用 当渲染重复数据的时候,React.diff会根据生成的key进行虚拟DOM渲染, 所以我们需要在遍历的地方都要加上key,例如map.for等等 ...
- [Centos7]无法访问配置好的nginx
Centos7无法访问配置好的nginx 临时生效 # 重启虚拟机,将失效 iptables -I INPUT -p TCP --dport 80 -j ACCEPT 永久有效 # 在防火墙中开放80 ...
- 7.10 其他面向对象设计原则1: 开-闭原则OCP
其他面向对象设计原则1: 开-闭原则OCP Open-Closed Principle (OCP)5.1 设计变坏的前兆 Signs of Rotting Design 僵硬性 Rigidit ...
- 『TensorFlow』读书笔记_VGGNet
VGGNet网络介绍 VGG系列结构图, 『cs231n』卷积神经网络工程实践技巧_下 1,全部使用3*3的卷积核和2*2的池化核,通过不断加深网络结构来提升性能. 所有卷积层都是同样大小的filte ...
- QANet
Reading Comprehension(RC) 阅读理解对于机器来说, 是一项非常艰巨的任务.google提出QANet, 目前(2018 0505)一直是SQuAD的No. 1. 今天简单地与大 ...
- [hdu P4114] Disney's FastPass
[hdu P4114] Disney's FastPass Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 32768/32768 ...
- 解決 centos -bash: vim: command not found
i. 那么如何安裝 vim 呢?输入rpm -qa|grep vim 命令, 如果 vim 已经正确安裝,会返回下面的三行代码: root@server1 [~]# rpm -qa|grep vim ...