[算法]从一道题引出variable-precision SWAR算法

苏君君出了一道题，是牛客网上面的：

输入一个int型整数，输出该数二进制表示中1的个数。其中负数用补码表示。

其实这道题并不难，大家很容易想到的解法是转成字符串的思路，即如下所示：

    public static int NumberOf1(int n) {

        String s = Integer.toBinaryString(n);

        int count = 0;

        for (int i = 0; i < s.length(); i++) {

            if(s.charAt(i) == '1'){

                count++;

            }

        }

        return count;

    }

但是这样运算速度不快。经过魏印福的点拨，知道了Redis中采用的variable-precision SWAR算法，这个算法非常厉害，因为他没有按照常规思路，而是采用了分组移位的思路。

参见博客：https://blog.csdn.net/jasonbaoly/article/details/47336899

算法实现：

int SWAR(unsigned int i)

{

    i = i - ((i >> ) & 0x55555555);

    i = (i & 0x33333333) + ((i >> ) & 0x33333333);

    return (((i + (i >> )) & 0x0F0F0F0F) * 0x01010101) >> ;

}

下面逐行解释一下：

第一行

i = i - ((i >> ) & 0x55555555);

0x55555555二进制的标识方式如下：

0x55555555 = 0b01010101010101010101010101010101

可以看到的规律是，奇数位为1,偶数位为0。
表达式((i >> 1) & 0x55555555)，将i右移一位，并将所有偶数位设置为0.（等效的，我们也可以通过& 0xAAAAAAAA将所有奇数位设置成0，然后再将结果右移1位）为了方便起见，我们将这个中间值命名为j。
当我们将中间值j从原始值i中减去会发生什么？那让我们来看看如果i只有两位是什么情况。

    i           j         i - j

----------------------------------

 = 0b00     = 0b00     = 0b00

 = 0b01     = 0b00     = 0b01

 = 0b10     = 0b01     = 0b01

 = 0b11     = 0b01     = 0b10

最后的结论就是i-j的十进制结果就是位数组中1出现的次数。
那么如果i不只是两位数组呢？实际上，很容易发现i-j的最低两位仍然如上表所示，三四位，五六位也是一个道理，等等。需要注意的是：

由于& 0x55555555的巧妙用法，尽管>> 1，i-j的最低两位不会被i的第三位或者更高的位影响。
由于j的最低两位永远不可能在比i的最低两位大。这个减法永远不会向i的第三位借位，因此：对于i-j来说，i的最低两位不会影响i的第三位或者更高位。

实际上这一行就是将32位数组分为16个两位为单位的组，每组分别计算1出现的次数。

第二行：

i = (i & 0x33333333) + ((i >> ) & 0x33333333);

与第一行对比，这一行非常的简单。首先，来看一下0x33333333的二进制表示：

0x33333333 = 0b00110011001100110011001100110011

i & 0x33333333的目的是以4位为分组取四位中的后两位。而(i >> 2) & 0x33333333在把i右移两位后做同样的工作。然后把它们结果加起来。
因此，实际上，这行做的工作就是将最低的两位1出现的次数和最低三四位的1出现的次数相加，得到最低四位的1出现的次数。同样的对于输入的8个四位分组（=16进制数）都是一样的。

第三行：

return (((i + (i >> )) & 0x0F0F0F0F) * 0x01010101) >> ;

(i + (i >> 4)) & 0x0F0F0F0F除了这次是用临近的4位1出现的次数系相加，得到8位为一组的1出现的次数，以外原理跟前一行一样。（和上一行有所不同的是，我们可以把&去掉，因为我们知道原始输入8位不可能出现超过8个1因此二进制值不会超过4位。）
现在我们有一个三十二位数，由四个字节组成，每个字节保存着原始输入中为1的位的数量。（我们把它们称作A，B，C和D。）那么为什么我们用0x01010101乘以这个值（命名为k）？

由于：

0x01010101 = ( << ) + ( << ) + ( << ) +

可得：

k * 0x01010101 = (k << ) + (k << ) + (k << ) + k

因此，最高位总和就是最终的结果，如下图所示：

k * 0x01010101最高位就是原始输入的1出现次数的最终结果。>> 24只是简单的将最高位的值移到最低位。

另一种更好理解的写法：

int SWAR(unsigned int i)

{

    x = (x & 0x55555555) + ((x >> ) & 0x55555555);

    x = (x & 0x33333333) + ((x >> ) & 0x33333333);

    x = (x & 0x0f0f0f0f) + ((x >> ) & 0x0f0f0f0f);

    i = (i*(0x01010101) >> )

    return i;

}