Apple的LZF算法解析

有关LZF算法的相关解析文档比较少，但是Apple对LZF的开源，可以让我们对该算法进行一个简单的解析。LZFSE 基于 Lempel-Ziv ，并使用了有限状态熵编码。LZF采用类似lz77和lzss的混合编码。使用3种“起始标记”来代表每段输出的数据串。

接下来看一下开源的LZF算法的实现源码。

1.定义的全局字段：

       private readonly long[] _hashTable = new long[Hsize];

        private const uint Hlog = ;

        private const uint Hsize = ( << );

        private const uint MaxLit = ( << );

        private const uint MaxOff = ( << );

        private const uint MaxRef = (( << ) + ( << ));

2.使用LibLZF算法压缩数据：

        /// <summary>

        /// 使用LibLZF算法压缩数据

        /// </summary>

        /// <param name="input">需要压缩的数据</param>

        /// <param name="inputLength">要压缩的数据的长度</param>

        /// <param name="output">引用将包含压缩数据的缓冲区</param>

        /// <param name="outputLength">压缩缓冲区的长度（应大于输入缓冲区）</param>

        /// <returns>输出缓冲区中压缩归档的大小</returns>

        public int Compress(byte[] input, int inputLength, byte[] output, int outputLength)

        {

            Array.Clear(_hashTable, , (int)Hsize);

            uint iidx = ;

            uint oidx = ;

            var hval = (uint)(((input[iidx]) << ) | input[iidx + ]);

            var lit = ;

            for (; ; )

            {

                if (iidx < inputLength - )

                {

                    hval = (hval << ) | input[iidx + ];

                    long hslot = ((hval ^ (hval << )) >> (int)((( *  - Hlog)) - hval * ) & (Hsize - ));

                    var reference = _hashTable[hslot];

                    _hashTable[hslot] = iidx;

                    long off;

                    if ((off = iidx - reference - ) < MaxOff

                        && iidx +  < inputLength

                        && reference >

                        && input[reference + ] == input[iidx + ]

                        && input[reference + ] == input[iidx + ]

                        && input[reference + ] == input[iidx + ]

                        )

                    {

                        uint len = ;

                        var maxlen = (uint)inputLength - iidx - len;

                        maxlen = maxlen > MaxRef ? MaxRef : maxlen;

                        if (oidx + lit +  +  >= outputLength)

                            return ;

                        do

                            len++;

                        while (len < maxlen && input[reference + len] == input[iidx + len]);

                        if (lit != )

                        {

                            output[oidx++] = (byte)(lit - );

                            lit = -lit;

                            do

                                output[oidx++] = input[iidx + lit];

                            while ((++lit) != );

                        }

                        len -= ;

                        iidx++;

                        if (len < )

                        {

                            output[oidx++] = (byte)((off >> ) + (len << ));

                        }

                        else

                        {

                            output[oidx++] = (byte)((off >> ) + ( << ));

                            output[oidx++] = (byte)(len - );

                        }

                        output[oidx++] = (byte)off;

                        iidx += len - ;

                        hval = (uint)(((input[iidx]) << ) | input[iidx + ]);

                        hval = (hval << ) | input[iidx + ];

                        _hashTable[((hval ^ (hval << )) >> (int)((( *  - Hlog)) - hval * ) & (Hsize - ))] = iidx;

                        iidx++;

                        hval = (hval << ) | input[iidx + ];

                        _hashTable[((hval ^ (hval << )) >> (int)((( *  - Hlog)) - hval * ) & (Hsize - ))] = iidx;

                        iidx++;

                        continue;

                    }

                }

                else if (iidx == inputLength)

                    break;

                lit++;

                iidx++;

                if (lit != MaxLit) continue;

                if (oidx +  + MaxLit >= outputLength)

                    return ;

                output[oidx++] = (byte)(MaxLit - );

                lit = -lit;

                do

                    output[oidx++] = input[iidx + lit];

                while ((++lit) != );

            }

            if (lit == ) return (int)oidx;

            if (oidx + lit +  >= outputLength)

                return ;

            output[oidx++] = (byte)(lit - );

            lit = -lit;

            do

                output[oidx++] = input[iidx + lit];

            while ((++lit) != );

            return (int)oidx;

        }

        /// <summary>

        /// 使用LibLZF算法解压缩数据

        /// </summary>

        /// <param name="input">参考数据进行解压缩</param>

        /// <param name="inputLength">要解压缩的数据的长度</param>

        /// <param name="output">引用包含解压缩数据的缓冲区</param>

        /// <param name="outputLength">输出缓冲区中压缩归档的大小</param>

        /// <returns>返回解压缩大小</returns>

        public int Decompress(byte[] input, int inputLength, byte[] output, int outputLength)

        {

            uint iidx = ;

            uint oidx = ;

            do

            {

                uint ctrl = input[iidx++];

                if (ctrl < ( << ))

                {

                    ctrl++;

                    if (oidx + ctrl > outputLength)

                    {

                        return ;

                    }

                    do

                        output[oidx++] = input[iidx++];

                    while ((--ctrl) != );

                }

                else

                {

                    var len = ctrl >> ;

                    var reference = (int)(oidx - ((ctrl & 0x1f) << ) - );

                    if (len == )

                        len += input[iidx++];

                    reference -= input[iidx++];

                    if (oidx + len +  > outputLength)

                    {

                        return ;

                    }

                    if (reference < )

                    {

                        return ;

                    }

                    output[oidx++] = output[reference++];

                    output[oidx++] = output[reference++];

                    do

                        output[oidx++] = output[reference++];

                    while ((--len) != );

                }

            }

            while (iidx < inputLength);

            return (int)oidx;

        }

以上是LZF算法的代码。

Apple的LZF算法解析的更多相关文章

地理围栏算法解析（Geo-fencing）
地理围栏算法解析 http://www.cnblogs.com/LBSer/p/4471742.html 地理围栏(Geo-fencing)是LBS的一种应用,就是用一个虚拟的栅栏围出一个虚拟地理边界 ...
KMP串匹配算法解析与优化
朴素串匹配算法说明串匹配算法最常用的情形是从一篇文档中查找指定文本.需要查找的文本叫做模式串,需要从中查找模式串的串暂且叫做查找串吧. 为了更好理解KMP算法,我们先这样看待一下朴素匹配算法吧.朴素 ...
Peterson算法与Dekker算法解析
进来Bear正在学习巩固并行的基础知识,所以写下这篇基础的有关并行算法的文章. 在讲述两个算法之前,需要明确一些概念性的问题, Race Condition(竞争条件),Situations lik ...
python常见排序算法解析
python——常见排序算法解析算法是程序员的灵魂. 下面的博文是我整理的感觉还不错的算法实现原理的理解是最重要的,我会常回来看看,并坚持每天刷leetcode 本篇主要实现九(八)大排序算法 ...
Java虚拟机对象存活标记及垃圾收集算法解析
一.对象存活标记 1. 引用计数算法给对象中添加一个引用计数器,每当有一个地方引用它时,计数器就加1:当引用失效时,计数器就减1:任何时刻计数器都为0的对象就是不可能再被使用的. 引用计数算法(Re ...
JVM垃圾回收算法解析
JVM垃圾回收算法解析标记-清除算法该算法为最基础的算法.它分为标记和清除两个阶段,首先标记出需要回收的对象,在标记结束后,统一回收.该算法存在两个问题:一是效率问题,标记和清除过程效率都不太高, ...
DeepFM算法解析及Python实现
1. DeepFM算法的提出由于DeepFM算法有效的结合了因子分解机与神经网络在特征学习中的优点:同时提取到低阶组合特征与高阶组合特征,所以越来越被广泛使用. 在DeepFM中,FM算法负责对一阶 ...
GBDT+LR算法解析及Python实现
1. GBDT + LR 是什么本质上GBDT+LR是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题.这个方法出自于Facebook 2014年的论文 Practical L ...
最长上升子序列(LIS)n2 nlogn算法解析
题目描述给定一个数列,包含N个整数,求这个序列的最长上升子序列. 例如 2 5 3 4 1 7 6 最长上升子序列为 4. 1.O(n2)算法解析看到这个题,大家的直觉肯定都是要用动态规划来做,那 ...

随机推荐

Unity自动寻路Navmesh之入门
实例我们要实现一个功能:点击场景中的一个位置,角色可以自动寻路过去.角色会绕过各种复杂的障碍,找到一条理论上”最短路径“. 步骤 1.创建地形 2.添加角色 3.创建多个障碍物,尽量摆的复杂一点,来 ...
[转]Tesseract 3.02中文字库训练
下载chi_sim.traindata字库下载tesseract-ocr-setup-3.02.02.exe 下载地址:http://code.google.com/p/tesseract-ocr/d ...
bzoj 2739 最远点
Description 给你一个N个点的凸多边形,求离每一个点最远的点. Input 本题有多组数据,第一行一个数T,表示数据组数. 每组数据第一行一个数N,表示凸多边形点的个数,接下来N对数,依次表 ...
EQueue - 一个纯C#写的分布式消息队列介绍2
一年前,当我第一次开发完EQueue后,写过一篇文章介绍了其整体架构,做这个框架的背景,以及架构中的所有基本概念.通过那篇文章,大家可以对EQueue有一个基本的了解.经过了1年多的完善,EQueue ...
WebForms VS. MVC（翻译）
(本文翻译自CodeProject上阿三写的一篇文章,原文地址:http://www.codeproject.com/Articles/528117/WebForms-vs-MVC,讲了有关ASP.A ...
进一步封装highchart，打造自己的图表插件：jHighChart.js
Highcharts 是一个用纯JavaScript编写的一个图表库, 能够很简单便捷的在web网站或是web应用程序添加有交互性的图表.支持的图表类型有曲线图.区域图.柱状图.饼状图.散状点图和综合 ...
在C#代码中应用Log4Net（五）将Log4Net正确地封装在自己的类库中并进行调用
前面的几篇文章已经比较完整地解释了怎么使用Log4Net,但是我们可能需要将Log4Net的日志类封装在自己的类库中,以便C/S或B/S程序进行调用.下面的示例程序简单地分为两层,一个是应用程序层We ...
一个Java程序员的实习总结（2）
在今天的总结里,主要讲述第二.三周这半个月的培训情况,并且穿插讲讲我对实习和见习的看法,有需要有兴趣的童鞋可以看看. 半个月的见习其实我更愿意把实习和见习分开讲,实习指的是还没签三方或者直接就是大三 ...
ASP.NET MVC 从零开始 - 请求处理
这篇文章是从我的 github 博客 lxconan.github.io 导入的. 这是这个系列的第三篇了.前两篇文章请参见: ASP.NET MVC 从零开始 - Create and Run AS ...
Node.js返回JSONP
在使用JQuery的Ajax从服务器请求数据或者向服务器发送数据时常常会遇到跨域无法请求的错误,常用的解决办法就是在Ajax中使用JSONP.基于安全性考虑,浏览器会存在同源策略,然而<scri ...

Apple的LZF算法解析

Apple的LZF算法解析的更多相关文章

随机推荐

热门专题