1. 前文回顾

  在字符串算法—数据压缩中,我们介绍了哈夫曼压缩算法(Huffman compression),本文将介绍LZW算法

  

2. LZW算法

  这个算法很简单,为了方便讲述,我们将采用16进制,写代码的时候在把它转回2进制就是了。

  在16进制下:A:41; B:42; C:43; D:44;......

  从例子入手:

  

  压缩表是边读数据边建立起来的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

  首先从第一个数据开始读:

  第一个字符为A, A在压缩表里已存在,值是41;

  

  下一个字符为B,B在压缩表里已存在,值是42;

  前一个字符A与这个字符B结合成AB,给它一个值:81;(为什么是81?因为41~79都被字母用了)

  把AB加到压缩表里:

  

  下一个字符为R,R在压缩表里已存在,值是52;

  前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

  

  下一个字符为A,A在压缩表里已存在,值是41;

  前一个字符R与这个字符A结合成RA,给它一个值:83,加到压缩表中:

  如此类推,一直到D那里:

  

  下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的AB也在压缩表里,我们取含字符最多的AB:

  前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

  

  下一个字符为R, R在压缩表里已存在,但下下一个字符为A,它们两组合而成的RA也在压缩表里,我们取含字符最多的RA;

  前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

  

  下一个字符为B, B在压缩表里已存在,但下下一个字符为R,它们两组合而成的BR也在压缩表里,我们取含字符最多的BR;

  前一个字符串RA与这个字符串的首字符B结合成RAB,给它一个值:89,加到压缩表中:

  

  下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的BR也在压缩表里; 但下下下一个字符为R,它们三组合而成的ABR也在压缩表里,我们取含字符最多的ABR;

  前一个字符串BR与这个字符串的首字符A结合成BRA,给它一个值:8A,加到压缩表中:

  

  下一个字符为A, A在压缩表里已存在,值为41;

  前一个字符串BRA与这个字符A结合成ABRA,给它一个值:8B,加到压缩表中:

  

  下一个字符为空,说明数据已经压缩完了,给个值80作为终止标记:

  

  压缩后的数据就是上述的值的组合,压缩表直接删除。

  压缩后的数据S:41425241434144818382884180。

  压缩的方法讲完了,那么如何解压呢?

  我们也是边解压边建表:

  现有压缩数据S:41425241434144818382884180。

  

  同样的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

  首先从第一个数据开始读:

  第一个值为41,对应字符A:

  

  下一个数据为42,对应字符B;

  前一个字符A与这个字符B结合成AB,给它一个值:81,加到压缩表中:

  

  下一个数据为52,对应字符R;

  前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

  

  如此类推,一直读到81:

  

  下一个数据为81,对应字符串AB;

  前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

  

  下一个数据为83,对应字符串RA;

  前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

  

  如此类推,一直读到80:

  

  下一个数据为80,这是压缩的终止值,说明解压完成了,此时,把压缩表丢掉。

  解压后得到原数据S:ABRACADABRABRABRA;

  由于我们的压缩表都是动态生成的,我们省了保存它的时间和空间。

  解压和压缩都介绍完了,这个算法也就结束了,超级简单!

  有时候解压时,会遇到些有趣的情形,如下图:

  原数据压缩:

  

  解压时:

  

  下一个数据为81,对应字符串AB;

  前一个字符B与这个字符串的首字符A结合成BA,给它一个值:82,加到压缩表中:

  

  下一个数据为83,嗯?83?83不在压缩表里啊,去哪找83?

  容我们冷静分析一波:

  首先,压缩表去到了82,下一个数据就是83。因为是83,所以肯定是个字符串。(81以上都是我们自己加的字符串!)

  假设83对应的字符串为X:

  

  前一个字符串AB与这个字符串的首字符X1(假设X是由X1X2X3...XN组成)结合成ABX1,给它一个值:83,加到压缩表中:

  

  即X=ABX1, X1是X的首字符(ABX1的首字符),即X1=A;

  故得知X=ABA:

  

  下一个数据是80,解压完成。解压后的原数据为ABABABA;

  至此,LZW算法介绍完毕。

实现代码:

  

超级简单的数据压缩算法—LZW算法的更多相关文章

  1. 数据压缩算法---LZ77算法 的分析与实现

    LZ77简介 Ziv和Lempel于1977年发表题为“顺序数据压缩的一个通用算法(A Universal Algorithm for Sequential Data Compression )”的论 ...

  2. 【Java/Android性能优 4】PreloadDataCache支持预取的数据缓存,使用简单,支持多种缓存算法,支持不同网络类型,扩展性强

    本文转自:http://www.trinea.cn/android/preloaddatacache/ 本文主要介绍一个支持自动向前或向后获取新数据的缓存的使用及功能.Android图片内存缓存可见I ...

  3. 【数据压缩】LZW算法原理与源代码解析

    转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/50331883 <勿在浮沙筑高台> LZW压缩算法原理很easy,因 ...

  4. LZW算法PHP实现方法 lzw_decompress php

    LZW算法PHP实现方法 lzw_decompress php 博客分类: Php / Pear / Mysql / Node.js   LZW算法简介 字符串和编码的对应关系是在压缩过程中动态生成的 ...

  5. zw版_Halcon图像交换、数据格式、以及超级简单实用的DIY全内存计算.TXT

    zw版_Halcon图像交换.数据格式.以及超级简单实用的DIY全内存计算.TXT Halcon由于效率和其他原因,内部图像采用了很多自有格式,提高运行速度,但在数据交换方面非常麻烦. 特别是基于co ...

  6. phpexcelreader超级简单使用

    phpexcelreader超级简单使用 该php类可以到官网下载:http://www.codeplex.com/PHPExcel,下载的文件不能直接使用要看下面的备注. 备注: 1.要将olere ...

  7. 哈,又一款超级简单的队列(MQ)实现方案来了~

    开源的消息队列已经很多了,但大部分很重,实际环境下,很多可能只是使用到了一点功能而已,杀鸡使用牛刀,着实有些浪费了.很多时候,我们只想要一片绿叶,但它们给了我们整个的春天,很难消化.本着DIR精神, ...

  8. html超级简单实现点赞(收藏)和取消赞效果

    1.前言 我们经常会遇到对一些列表呀进行点赞呀收藏数据等效果呀.今天就用html+css实现超级简单易上手的点赞和取消赞的demo展示. 2.详情 1.css样式 .like{ font-size:6 ...

  9. 图像数据到网格数据-1——MarchingCubes算法

    原文:http://blog.csdn.net/u013339596/article/details/19167907 概述 之前的博文已经完整的介绍了三维图像数据和三角形网格数据.在实际应用中,利用 ...

随机推荐

  1. UVA1401 Remember the Word

    思路 用trie树优化dp 设f[i]表示到第i个的方案数,则有\(f[i]=\sum_{x}f[i+len[x]]\)(x是s[i,n]的一个前缀),所以需要快速找出所有前缀,用Trie树即可 代码 ...

  2. 20175312 2018-2019-2 《Java程序设计》第2周学习总结

    20175312 2018-2019-2 <Java程序设计>第2周学习总结 教材学习内容总结 已依照蓝墨云班课的要求完成了第二.三章的学习,主要的学习渠道是视频,和书的课后习题. 总结如 ...

  3. HDU2476 String painter——区间DP

    题意:要把a串变成b串,每操作一次,可以使a串的[l,r]区间变为相同的一个字符.问把a变成b最少操作几次. 这题写法明显是区间dp ,关键是处理的方法. dp[l][r]表示b串的l~r区段至少需要 ...

  4. Unity3d外包-就找北京动点软件

    承接Unity3d体感企业项目.游戏项目外包 北京公司.专业团队,成员为专业Unity3d产品公司一线开发人员,有大型产品开发经验: 提供优质的售后服务,保证产品质量,轻量级产品可以提供规范清晰的源代 ...

  5. [译] 关于 Angular 依赖注入你需要知道的

    如果你之前没有深入了解 Angular 依赖注入系统,那你现在可能认为 Angular 程序内的根注入器包含所有合并的服务提供商,每一个组件都有它自己的注入器,延迟加载模块有它自己的注入器. 但是,仅 ...

  6. Spring 中StopWatch用法

    背景 有时我们在做开发的时候需要记录每个任务执行时间,或者记录一段代码执行时间,最简单的方法就是打印当前时间与执行完时间的差值,然后这样如果执行大量测试的话就很麻烦,并且不直观,如果想对执行的时间做进 ...

  7. 【文献07】基于MPC的WMR点镇定-极坐标系下和轨迹跟踪

    参考: Kuhne F , Lages W , Silva J D . Point stabilization of mobile robots with nonlinear model predic ...

  8. Echart数据转换(水平数据变成垂直数据)

    var originaldatalist = [ { name: "周一", data: [ { name: "直接访问", data: 320 }, { na ...

  9. jvm回收器回收过程一:CMS和 G1的初认知(持续更新中)

    CMS:介绍: 1.CMS(Concurrent Mark-Sweep)是以牺牲吞吐量为代价来获得最短回收停顿时间的垃圾回收器.对于要求服务器响应速度的应用上,这种垃圾回收器非常适合. 在启动JVM参 ...

  10. Delegate, NSNotification, KVO, Block

    delegate: 当我们第一次编写iOS应用时,我们注意到不断的在使用“delegate”,并且贯穿于整个SDK.delegation模式不是iOS特有的模式,而是依赖与你过去拥有的编程背景.针对它 ...