Base 128 Varints 编码（压缩算法）

Base 128 Varint可以说是一种编码方式，也可以说是一种压缩算法。这种压缩算法是用来压缩数字的传输的，压缩的依据是基于一个现实：越小的数字，越经常使用

我们来看看一个例子：

如果我们要网络传输数字1，会怎样传输呢？

假设我们用的是32位的整形传输，那么经过编码，这个1的传输形式是：

00000000 00000000 00000000 00000001

然而，在这一堆要传输的数据里，几乎所有的0都是无效数据（除了最后一个字节里，那些0没办法的无效填充），但是由于编码的限制，又不得不把这堆0加上去。Base 128 Varints 编码要解决的就是这个事情。那么，Base 128 Varint是如何编码的呢？

（1）除了最后一个字节，varint中的每个字节的最高位设为1，表示后面还有字节出现

（2）每个字节的低7位看成是一个组（group），这个组和他相邻的下一个7位组共同存储某个整形的“组合表示”，最低有效组在前面。

很抽象，还是举例子说明一下

（1）1个字节，假设数字是 0000 0001

则经过Base 128 Varint编码后，还是原来的样子（0000 0001）

（2）2个字节，这次我们来个解码，假设经过Base 128 Varint编码后的01串是 1010 1100 0000 0010

根据定义，第1个字节的最高位是1，说明后面还是有数据。我们往后看，第2个字节的最高位是0，好，说明这个数编码后是使用2字节的了。

取第1个字节的低7位，为：0101100

取第2个字节的低7位，为：0000010

我们再来看这句：最低有效组在前面

然后倒过来组合起来，即为原01串：

0000010 0101100（即十进制的300）

PS：这里的倒装方式涉及到编码方式的大小端

（3）3个字节，我们来看看怎么对 0110 1011 0110 0011进行编码

a.从低位到高位，取7位为一个组（不足7位前面补0），这里为

1100011

1010110

0000001

b.反转组装 1100011 1010110 0000001

c.除了在最后一个字节补0，其他字节补1，即为：11100011 11010110 00000001

（4）更多字节

聪明的你应该已经发现了，用Base 128 Varint编码的最大表示数为2^28，非常正确，同时说明了，天下没有免费的午餐，有得必有失。但是，大家还记得前面说的那句话吗：压缩的依据是基于一个现实：越小的数字，越经常使用 ，所以，这个压缩算法，是满足绝大部分情况的。当然，如果传输的数字都是比较大的特殊情况，就不推荐这种算法了

PS:如何确认一个数字经过Base 128 Varint要用多少字节的传输或存储：

1个字节的Base 128 Varint编码后，有7位可以存储，即可以传输数字为 0-2的7次方

以此类推：2个字节是2的14次方，3个字节为2的21次方

Base 128 Varints 编码（压缩算法）的更多相关文章

C# base 64图片编码解码
使用WinForm实现了图片base64编码解码的效果图: 示例base 64编码字符串: /9j/4AAQSkZJRgABAQEAYABgAAD/2wBDAAgGBgcGBQgHBwcJCQgKD ...
RLE行程长度编码压缩算法
在看emWIN的时候看到一个图片压缩的算法可以有效的对二值图(简单的2中颜色或者更多)进行压缩,压缩的效果可以节省空间而且不丢失信息! 特点一种压缩过的位图文件格式,RLE压缩方案是一种极其成熟的压 ...
Huffman 编码压缩算法
前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法.相信大家应该听说过 David Huffman 和他的压缩算法—— Huffman Code,一种通过字 ...
[转载]Huffman编码压缩算法
转自http://coolshell.cn/articles/7459.html 前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法.相信大家应该听说过 D ...
解决UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 12: ordinal not in range(128)的编码问题
当我在运行一个基于scrapy的爬虫时出现UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 12: ordina ...
huffman编码压缩算法（转）
参考:http://blog.csdn.net/sunmenggmail/article/details/7598012 笔试时遇到的一道题.
zigzag压缩算法
前文 Base 128 Varints 编码(压缩算法) 介绍了Base 128 Varints这种对数字传输的编码,了解到了这种编码方式是为了最大程度压缩数字的.但是,在前文里,我们只谈论到了正数的 ...
高效的数据压缩编码方式 Protobuf
一. protocol buffers 是什么? Protocol buffers 是一种语言中立,平台无关,可扩展的序列化数据的格式,可用于通信协议,数据存储等. Protocol buffers ...
varints
Protocol Buffer技术详解(数据编码) - Stephen_Liu - 博客园 https://www.cnblogs.com/stephen-liu74/archive/2013/01/ ...

随机推荐

喝完可乐桶后程序员回归本源，开源Spring基础内容
周六了,又是摸鱼的一天,今天还有点不在状态,脑瓜子迷迷糊糊的,昨晚出去喝可乐桶喝的脑子到现在都不是很正常(奉劝各位可以自己小酌:450ml威士忌+1L多一点可乐刚刚好,可能是我酒量不好),正好没啥事就 ...
moviepy音视频剪辑：视频半自动追踪人脸打马赛克
一.引言在<moviepy1.03音视频剪辑:使用manual_tracking和headblur实现追踪人脸打马赛克>介绍了使用手动跟踪跟踪人脸移动轨迹和使用headblur对人脸进行 ...
老猿学5G：融合计费场景的Nchf_ConvergedCharging_Create、Update和Release融合计费消息交互过程
☞ ░ 前往老猿Python博文目录 ░ 一.Nchf_ConvergedCharging_Create交互过程 Nchf_ConvergedCharging_Create 服务为CTF向CHF请求提 ...
PyQt(Python+Qt)学习随笔：Qt Designer中部件的windowIcon属性
windowIcon对象为部件对象的属性,但只有窗口对象有效,其他派生对象如pushButtong对象无效. 在windowIcon对象上有如下子属性设置: 这几个子属性实际上是QIcon类中继承的. ...
PyQt(Python+Qt)学习随笔：Qt Designer中toolBar的floatable属性
floatable属性用于保存工具栏是否可以作为独立小窗口拖放,其类型为bool类型,默认值为True,表示工具栏可以漂作为独立窗口拖放. 下图是漂浮在窗口上的工具栏案例: 可以通过isFloatab ...
一文搞懂RESTful API
RESTful接口实战原创公众号:bigsai 转载请联系bigsai 文章收藏在回车课堂前言在学习RESTful 风格接口之前,即使你不知道它是什么,但你肯定会好奇它能解决什么问题?有什么应用 ...
Java堆内存中为什么有两个survival区及为什么与年轻代比例是1：1：8？
Java堆内存分为年轻代和老年代,其中,年轻代分为Eden区和survival区,survival又分为fromSurvival和toSurvival. 首先第一个问题:为什么要有Survival区? ...
SSM框架中常用的注解及含义
@Controller---使用它标记在一个类上,dispatcher会扫描使用该注解类的方法,并检测该方法是否使用了@RequestMapping注解,加上RequestMapping注解的方法才是 ...
5+App 相关记录
一.页面跳转到app 1.应用的manifest.json文件,plus --> distribute --> google 节点下,增加属性 schemes 2.打包后,在手机里安装. ...
Python零散知识点记录
1.关于setdefaultencoding之前必须reload(sys): 要在调用setdefaultencoding时必须要先reload一次sys模块,因为这里的import语句其实并不是sy ...

Base 128 Varints 编码（压缩算法）

Base 128 Varints 编码（压缩算法）的更多相关文章

随机推荐

热门专题