LZW算法PHP实现方法 lzw

LZW算法PHP实现方法 lzw_decompress php

博客分类：

Php / Pear / Mysql / Node.js

LZW算法简介

字符串和编码的对应关系是在压缩过程中动态生成的，并且隐含在压缩数据中，解压的时候根据表来进行恢复，算是一种无损压缩.

根据 Lempel-Ziv-Welch Encoding ，简称 LZW 的压缩算法，用任何一种语言来实现它.

LZW压缩算法[1]的基本概念：LZW压缩有三个重要的对象：数据流（CharStream）、编码流（CodeStream）和编译表（String Table）。在编码时，数据流是输入对象（文本文件的据序列），编码流就是输出对象（经过压缩运算的编码数据）；在解码时，编码流则是输入对象，数据流是输出对象；而编译表是在编码和解码时都须要用借助的对象。字符（Character）：最基础的数据元素，在文本文件中就是一个字节，在光栅数据中就是一个像素的颜色在指定的颜色列表中的索引值；字符串（String）：由几个连续的字符组成；前缀（Prefix）：也是一个字符串，不过通常用在另一个字符的前面，而且它的长度可以为0；根（Root）：一个长度的字符串；编码（Code）：一个数字，按照固定长度（编码长度）从编码流中取出，编译表的映射值；图案：一个字符串，按不定长度从数据流中读出，映射到编译表条目.

LZW压缩算法的基本原理：提取原始文本文件数据中的不同字符，基于这些字符创建一个编译表，然后用编译表中的字符的索引来替代原始文本文件数据中的相应字符，减少原始数据大小。看起来和调色板图象的实现原理差不多，但是应该注意到的是，我们这里的编译表不是事先创建好的，而是根据原始文件数据动态创建的，解码时还要从已编码的数据中还原出原来的编译表.

<?php

/**

* @link http://code.google.com/p/php-lzw/

* @author Jakub Vrana, http://php.vrana.cz/

* @copyright 2009 Jakub Vrana

* @license http://www.apache.org/licenses/LICENSE-2.0 Apache License, Version 2.0

*/

/** LZW compression

* @param string data to compress

* @return string binary data

*/

function lzw_compress($string) {

    // compression

    $dictionary = array_flip(range("\0", "\xFF"));

    $word = "";

    $codes = array();

    for ($i=; $i <= strlen($string); $i++) {

        $x = $string[$i];

        if (strlen($x) && isset($dictionary[$word . $x])) {

            $word .= $x;

        } elseif ($i) {

            $codes[] = $dictionary[$word];

            $dictionary[$word . $x] = count($dictionary);

            $word = $x;

        }

    }

    // convert codes to binary string

    $dictionary_count = ;

    $bits = ; // ceil(log($dictionary_count, 2))

    $return = "";

    $rest = ;

    $rest_length = ;

    foreach ($codes as $code) {

        $rest = ($rest << $bits) + $code;

        $rest_length += $bits;

        $dictionary_count++;

        if ($dictionary_count > ( << $bits)) {

            $bits++;

        }

        while ($rest_length > ) {

            $rest_length -= ;

            $return .= chr($rest >> $rest_length);

            $rest &= ( << $rest_length) - ;

        }

    }

    return $return . ($rest_length ? chr($rest << ( - $rest_length)) : "");

}

/** LZW decompression

* @param string compressed binary data

* @return string original data

*/

function lzw_decompress($binary) {

    // convert binary string to codes

    $dictionary_count = ;

    $bits = ; // ceil(log($dictionary_count, 2))

    $codes = array();

    $rest = ;

    $rest_length = ;

    for ($i=; $i < strlen($binary); $i++) {

        $rest = ($rest << ) + ord($binary[$i]);

        $rest_length += ;

        if ($rest_length >= $bits) {

            $rest_length -= $bits;

            $codes[] = $rest >> $rest_length;

            $rest &= ( << $rest_length) - ;

            $dictionary_count++;

            if ($dictionary_count > ( << $bits)) {

                $bits++;

            }

        }

    }

    // decompression

    $dictionary = range("\0", "\xFF");

    $return = "";

    foreach ($codes as $i => $code) {

        $element = $dictionary[$code];

        if (!isset($element)) {

            $element = $word . $word[];

        }

        $return .= $element;

        if ($i) {

            $dictionary[] = $word . $element[];

        }

        $word = $element;

    }

    return $return;

}

项目：https://code.google.com/p/php-lzw/

LZW算法PHP实现方法 lzw_decompress php的更多相关文章

超级简单的数据压缩算法—LZW算法
1. 前文回顾在字符串算法—数据压缩中,我们介绍了哈夫曼压缩算法(Huffman compression),本文将介绍LZW算法. 2. LZW算法这个算法很简单,为了方便讲述,我们将采用16进制 ...
【数据压缩】LZW算法原理与源代码解析
转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/50331883 <勿在浮沙筑高台> LZW压缩算法原理很easy,因 ...
【java基础 10】hash算法冲突解决方法
导读:今天看了java里面关于hashmap的相关源码(看了java6和java7),尤其是resize.transfer.put.get这几个方法,突然明白了,为什么我之前考数据结构死活考不过,就差 ...
Hash算法冲突解决方法分析
采用开放定址法处理散列表的冲突时,其平均查找长度? 高于链接法处理冲突低于二分查找开放定址法:一旦发生冲突,就去寻找下一个空的散列地址,只要散列地址够大,空的地址总会找到链地址法: 一旦发生冲 ...
算法 -- 四种方法获取的最长“回文串”，并对时间复杂进行分析对比&PHP
https://blog.csdn.net/hongyuancao/article/details/82962382 “回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就 ...
Arrays的排序算法sort及方法使用
Java工具包中的Arrays工具类里面有数组的快速排序算法. 源码如下: /** * Sorts the specified range of the array using the given * ...
[转]SPFA算法的玄学方法
最近想到了许多优化spfa的方法,这里想写个日报与大家探讨下前置知识:spfa(不带任何优化) 由于使用较多 STLSTL ,本文中所有代码的评测均开启 O_2O2 优化对一些数组的定义: di ...
读书笔记-2java虚拟机的可达性算法与finalize方法
JAVA通过可达性分析算法来确定堆中哪些对象是应该被回收的. 非常多人包含我曾经在不了解的时候总以为是通过引用计数器来推断某个对象是否应该被回收可是后来想了想包含查阅一些资料发现不是这种.由于假设採用 ...
php 中的查找算法和排序方法(多字段排序)
一.查找算法 1.顺序查找(一个一个查,效率低,不用多说) 2.二分查找 /* php 二分查找在$a数组里查找$x的位置 $a必须是一个以升序排序后的数组 */ function binsearc ...

随机推荐

pygm2安装问题
pygm2是python的一个库,它提供了大部分数学处理的方式,今天在查看自己环境后,发现这个环境还没有安装上,于是,自己动手丰衣足食吧,我的系统为win10家庭版,首先执行的pip install ...
【ABP】ABP跨域调用API时出现的问题
public override void Initialize() { IocManager.RegisterAssemblyByConvention(Assembly.GetExecutingAss ...
UVA 509 RAID!
思路来自:https://blog.csdn.net/wcr1996/article/details/43834545 先解释一下题意: ①输入:先输入d(disk的数量) s(每块数据块有s个bi ...
VBA中FIND方法的使用说明zz
Find 方法在区域中查找特定信息. 语法表达式.Find(What, After, LookIn, LookAt, SearchOrder, SearchDirection, MatchCase, ...
wiki Confluence 百科介绍
Confluence是一个专业的wiki程序. 它是一个知识管理的工具, 通过它可以实现团队成员之间的协作和知识共享. Confluence不是一个开源软件, 非商业用途可以免费使用. Conflue ...
潭州课堂25班：Ph201805201 django 项目第四十二课后台课程相关，用户组管理（课堂笔记）
在线课程: 当点击进入页面时,显示所有课程 def get(self, request): courses = Course.objects.select_related('category', 't ...
潭州课堂25班：Ph201805201 django 项目第三十六课后台文章管理（课堂笔记）
get 请求, 1,获取文章标签 , 2,拿到前台传来的值, 3,根据前台传来的值在数据库中查询 4.,返回数据到前台,渲染, 分页算法 : 在 utils 下创建 paginator_script ...
[IOI2014]Wall
[IOI2014]Wall 题目大意: 给你一个长度为$n(n\le2\times10^6)$的数列,初始全为$0$.$m(m\le5\times10^5)$次操作,每次让区间\([l_i ...
TypeScript语法学习--基本类型
查看官方文档手册:链接:https://www.tslang.cn/docs/home.html (一)Boolean 最基本的数据类型就是简单的true/false值 The most basic ...
2018年东北农业大学春季校赛 E-wyh的阶乘(求n!的0的个数)
链接:https://www.nowcoder.com/acm/contest/93/E来源:牛客网题目描述这个问题很简单,就是问你n的阶乘末尾有几个0? 输入描述: 输入第一行一个整数T(1&l ...

LZW算法PHP实现方法 lzw_decompress php

LZW算法PHP实现方法 lzw_decompress php

LZW算法PHP实现方法 lzw_decompress php的更多相关文章

随机推荐

热门专题