variable precision SWAR算法

计算二进制形式中1的数量这种问题，在各种刷题网站上比较常见，以往都是选择最笨的遍历方法“蒙混”过关。在了解Redis的过程中接触到了variable precision SWAR算法（以下简称VP-SWAR算法），算法异常简洁，是目前已知的同类方法中最快的。但如果对于位运算不是很熟悉的话，却不一定容易理解，所以有必要记录一下。

下面先看看VP-SWAR算法的完整实现，然后再逐行解释。

  public int vpSWAR(int i){

    i = (i & 0x55555555) + ((i>>1) & 0x55555555);

    i = (i & 0x33333333) + ((i>>2) & 0x33333333);

    i = (i & 0x0F0F0F0F) + ((i>>4) & 0x0F0F0F0F);

    i = (i * 0x01010101) >> 24;

    return i;

  }

VP-SWAR算法分为四步，第一步

i = (i & 0x55555555) + ((i>>1) & 0x55555555);

第一步的作用是计算每两位为一组的二进制形式包含1的个数。要理解这句话，我们需要从二进制的角度看看到底发生了什么。首先， 0x55555555 的二进制表示为 0101 0101 0101 0101 0101 0101 0101 0101 ，这个数字的规律是基数位为1，偶数位为0。为简单起见，我们只考虑两位，总共有四种情况，即：

i	x	i & x 结果
00	01	00
01	01	01
10	01	00
11	01	01

这里用x代表0b01(0b表示二进制)观察发现， i & (0b01) 是i的基数位对应x的1位，i的偶数位对应着x的0位， i & (0b01) 的结果会将i的偶数位置为0，而基数位保持不变，得到的结果就是i的基数位包含1的个数。 (i >> 1) & 0x55555555 先将i右移一位，也就是将i的基数位对应x的0位，i的偶数位对应着x的1位，然后再与 0x55555555 按位与，计算出来的是i的偶数位包含1的个数。两个计算结果相加就得到i每两位为一组中包含的1的数量，我们最后需要的就是这每两位一组的和。

第二步是在第一步的基础上，计算每四位为一组包含1的个数。按照每2位为一组分组用到了 0x55555555 这个数，那么自然的，按照每4位为一组分组自然就需要 0b0011 这种形式，这就是使用 0x33333333 的原因。理论上， i & (0b0011) 总共有16种情况，但是四位二进制位最多包含4个1，用二进制表示为 0b0100 ，所以经过第一步之后，i最多有5种取值，如下：

i	x	i & x 结果
0000	0011	0000
0001	0011	0001
0010	0011	0010
0011	0011	0011
0100	0011	0000

观察发现， i & (0b0011) 得到的是i的低两位包含1的个数， (i >> 2) & 0b0011)得到的是i的高两位包含的1的个数，两个结果相加得到每四位包含的1的个数。注意，这里并不是说任何数与 0b0011 按位与得到的都是低两位包含的1的个数，这里的前提是第一步的计算，因为经过第一步计算之后，每两位包含多少个1已经记录了下来，再和 0b0011 按位与才得到正确的结果。例如， 0x0010 & 0x 0011=0x0010 ，但是我们不能说 0x0010 包含两个1，但是如果 0x0010 是经过第一步的计算得来，那才说明 0x0010 记录原始数据低两位有两个1。

第三步在第二步基础上，计算每8位有多少个1，由 0x01 和 0x0011 ，很自然想到 0x00001111 ，其对应的32位的十六进制数就是 0x0F0F0F0F 。

第四步就很有意思了，它不再是计算每16位包含1的个数，而是直接计算32位包含1的个数。对于32位的数来说，可以将其按每8位一组分为4组，分别用ABCD表示，例如 0x01020304 用这种形式表示为：

假设 0x01020304 是经过前三步计算之后得到的结果，那么要计算其总共包含多少个1，只需计算A+B+C+D。而ABCD表示的是不同的位区间范围，不能直接相加，该如何快速计算A+B+C+D的值呢？这里又用到了移位运算，将B、C、D分别左移8位、16位、24位，使其分别与A对齐：

我们发现，将数字i分别左移0位、8位、16位、24位然后相加的结果，就是 i * 0x01010101 ，因为 i + (i << 8) + (i << 16) + (i << 24) = i * (1 + 1 << 8 + 1 << 16 + 1 << 24) = i * 0x01010101 。对于32位数字来说，左移之后超过32位的部分会被舍弃，低位补0，将左移之后得到的四个数字相加，结果的高8位的值就是原32位数包含的1的个数，要得到这个值，只需要将结果右移24位，将值放在低8位即可。

到这里，整个算法就结束了，右移的结果就是1的数量。在Redis中，BITCOUNT命令同时使用了查表法和VP-SWAR这两种方法。当要计算的位数小于128位时，使用查表法，否则使用VP-SWAR算法。其中查表法的做法是，程序先存一个256长度的表，按顺序记录从0-255（即 0b00000000 - 0b11111111）数中二进制1的个数，然后对于输入参数每8位查一次表。

variable precision SWAR算法的更多相关文章

variable-precision SWAR算法介绍
BITCOUNT命令是统计一个位数组中非0进制位的数量,数学上称作:”Hanmming Weight“ 目前效率最好的为variable-precision SWAR算法,可以常数时间内计算出多个字节 ...
variable-precision SWAR算法：计算Hamming Weight
variable-precision SWAR算法:计算Hamming Weight 转自我的Github 最近看书看到了一个计算Hamming Weight的算法,觉得挺巧妙的,纪录一下. Hamm ...
[算法]从一道题引出variable-precision SWAR算法
苏君君出了一道题,是牛客网上面的: 输入一个int型整数,输出该数二进制表示中1的个数.其中负数用补码表示. 其实这道题并不难,大家很容易想到的解法是转成字符串的思路,即如下所示: public st ...
redis bitcount variable-precision swar算法
花了不到一周的时间看完了一本reids设计与实现的书,感觉整体的设计有些地方的确很巧妙,各个结构之间联系的非常紧密,但是很简单,逻辑性的没有太多,但是学到了一个bitcount计数1的方法比较巧妙,记 ...
General Decimal Arithmetic 浮点算法
General Decimal Arithmetic http://speleotrove.com/decimal/ General Decimal Arithmetic [ FAQ | Decima ...
Redis设计与实现-附加功能
发布与订阅 redis订阅分为精准的频道订阅与模糊匹配的模式订阅: redis将所有频道的订阅关系都保存在服务器状态pubsub_channels字典里,键是频道名,值是一个记录所有订阅此频道的客户端 ...
IEEE论文格式要求
0.特别提示:本次会议要求各位作者根据审稿意见进行认真修改,然后经过大会主席的检查合格才允许上传IEEE eXpress,主要的目的是为了保证论文集的质量,不让论文格式出现五花八门的情况,确保会议后被 ...
MATLAB中digits和vpa
digits: DIGITS Set variable precision digits. Digits determines the accuracy of variable precision n ...
SIMD---AVX系列
AVX全称Advanced Vcetor Extension,是对SSE的后续扩展,主要分为AVX.AVX2.AVX512三种.在目前常见的机器上,大多只支持到AVX系列,因此其他SIMD扩展指令我们 ...

随机推荐

小白学 Python（2）：基础数据类型（上）
人生苦短,我选Python 引言前文传送门小白学 Python(1):开篇接触一门新的语言,肯定要先了解它的基础数据类型.啥?你问我为啥要先了解基础数据类型? 为了你的生命安全,还是乖乖听我 B ...
django搭建BBS-表单创建&注册
django搭建BBS-表单创建&注册 0824自我总结文件结构 app 接口 migrations __inint__.py admin.py 管理员页面注册表单用 apps.py bbs ...
VirtualBox for Mac 6.0.14 开源免费虚拟机方案
VirtualBox for mac是一款开源虚拟机软件,你可以利用该软件在Mac OS平台上运行Windows软件,即可以在一定程度上弥补Mac OS平台软件不足的劣势,玩家也可以获得Windows ...
简单使用OpenSSL生成密钥
一.生成自签名证书 1.1.创建root CA私钥 openssl req -newkey rsa:4096 -nodes -sha256 -keyout ca.key -x509 -days 365 ...
HDU 6112 今夕何夕 (预处理枚举)
中文题意都看的懂啦~ 思路很简单,就是通过前一天推出当天是星期几,直接枚举所有2017-9999年的每一天就好了.ㄟ( ▔, ▔ )ㄏ代码: #include <cstdio> #def ...
vue.js 使用 vue-router 修改页面标题
module.exports = { name: 'myComponent', data: {} route{ data: function(){ document.title = "页面标 ...
seq2seq+attention解读
1什么是注意力机制? Attention是一种用于提升Encoder + Decoder模型的效果的机制. 2.Attention Mechanism原理要介绍Attention Mechanism ...
设计模式C++描述----14.外观(Facade)模式
一. 举例说明还以我以前做的文件系统(FileSys)为例: 文件系统是一个独立的系统,它提供一套核心的文件操作. 除了文件系统,还有四个子系统,分别是杀毒子系统(KillVirus),压缩子系统( ...
mysql实现海量数据的存储、访问的解决方案
mysql实现海量数据的存储.访问的解决方案: mysql数据库水平切分的实现原理可分为以下几个:分库,分表,主从,集群,负载均衡器等第1章引言随着互联网应用的广泛普及,海量数据的存储和访问成为 ...
【Redis深度历险】那些年Redis的数据结构
[Redis深度历险]那些年Redis的数据结构 Redis端口号6379的来源 Redis的端口号是6379,但这个端口号并不是随机选择的,源于"MERZ",这个单词在手机当中的 ...

variable precision SWAR算法

variable precision SWAR算法的更多相关文章

随机推荐

热门专题