今天讲个有趣的算法:如何快速求 \(n^m\),其中 n 和 m 都是整数。

为方便起见,此处假设 m >= 0,对于 m < 0 的情况,求出 \(n^{|m|}\) 后再取倒数即可。

另外此处暂不考虑结果越界的情况(超过 int64 范围)。

当然不能用编程语言的内置函数,我们只能用加减乘除来实现。

n 的 m 次方的数学含义是:m 个 n 相乘:n*n*n...*n,也就是说最简单的方式是执行 m 次乘法。

直接用乘法实现的问题是性能不高,其时间复杂度是 O(m),比如 \(3^{29}\) 要执行 29 次乘法,而乘法运算是相对比较重的,我们看看能否采用什么方法将时间复杂度降低。

设 m = x + y + z(x、y、z 都是整数),我们知道有如下数学等式: \(n^m\) = \(n^{x+y+z}\) = \(n^x * n^y * n^z\)。

也就是说,如果我们已经知道 \(n^x\)、\(n^y\)、\(n^z\) 的值,是不是就可以直接用他们相乘得出 \(n^m\)的结果?这样的话乘的次数就大大降低了。

于是问题就变成应该将 m 拆成怎样的几个数的和。

因为计算机是玩二进制的,我们尝试着将这些数跟 2 扯上联系(以 2 为底),看看会不会有奇迹发生。

我们看看具体的例子:\(3^{29}\)。

我们将 29 做这样的拆分:29 = 16 + 8 + 4 + 1。

这个拆分有什么特点呢?右边的数都是 2 的 X 次方(\(2^4 + 2^3 + 2^2 + 2^0\))。

我们把上面的拆分带进公式:\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\)。

那我们能不能知道 \(3^{16}\)、\(3^{8}\)、\(3^{4}\)、\(3^{1}\) 是什么呢?

我们不用计算就知道 \(3^{1}\) 是什么——但仅此而已。

不过我们可以用 \(3^{1}\) 自乘 4 次的到 \(3^4\);然后再用 \(3^4\) 自乘得到 \(3^8\);再通过 \(3^8\) 自乘得到 \(3^{16}\)。

好像有点感觉了——我们每做一次乘法,就能将结果翻倍(如 \(3^4\) 自乘就变成 \(3^4*3^4 = 3^8\))。

如此,虽然也要多次乘法,但乘的次数从 29 次降到 9 次!

然后我们再回头看看上面的拆分:

29 = 16 + 8 + 4 + 1 = \(2^4 + 2^3 + 2^2 + 2^0\) = \(1*2^4 + 1*2^3 + 1*2^2 + 0*2^1 + 1*2^0\) 。

这不就是学校学的二进制转十进制吗(29 的二进制是 11101)?

\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\) 是说:取 29 的二进制表示中所有值是 1 的位,算出它们的指数值并相乘就得到最终的值。

我们用 go 语言实现一下:

// 求 a 的 n 次方
// a、n 是非负整数
func Pow(a,n int64) int64 {
// 0 的任何次方都是 0
if a == 0 {
return 0
} // 任何数的 0 次方都是 1
if n == 0 {
return 1
} // 1 次方是它自身
if n == 1 {
return a
} // 用滚雪球的方式计算幂
// 雪球初始值是 1
var result int64 = 1
// 滚动因子初始化为 a 的 1 次方(a 自身)
factor := a
// 循环处理直到 n 变成 0(所有的二进制位都处理完了)
for n != 0 {
// 跟 1 做与运算,判断当前要处理的位是不是 1
// 之所以是直接跟 1 做与运算,因为后面每处理一轮都将 n 右移了一位,保证每次要处理的位都在最低位
if n & 1 != 0 {
// 当前位是 1,需要乘进去
result *= factor
}
// 每轮结束时将滚动因子自乘
// 因为每行进一轮,指数都翻倍,整体结果就是自乘
// 比如本轮因子是 2**4,下一轮就是 2**8
// 2**8 = 2**(4+4) = 2**4 * 2**4
// (** 表示指数)
factor *= factor
// n 右移一位,将下一轮要处理的位放在最低位
n = n >> 1
} return result
}

有什么用呢?

很多语言内置的 pow 函数都只接受浮点数,浮点数的运算是非常重的,如果我们的程序需要频繁计算整数的幂,就可以采用 quick pow 算法代替语言内置的幂函数以提升性能。

我们对 go 语言内置的 math.Pow 和 quick pow 算法做个性能测试对比一下。

// 测试 3 的 29 次方的性能测试
var benchPowB int64 = 3
var benchPowP int64 = 29 // 上面的 quick pow 算法
func BenchmarkQuickPow(b *testing.B) {
for i := 0; i < b.N; i++ {
algo.Pow(benchPowB, benchPowP)
}
} // go 语言 math 包的 Pow 方法,只接受 float64 类型
func BenchmarkInnerPow(b *testing.B) {
x := float64(benchPowB)
y := float64(benchPowP)
for i := 0; i < b.N; i++ {
math.Pow(x, y)
}
} // 用简单乘法实现(3 自乘 29 次)
func BenchmarkSimpleMulti(b *testing.B) {
for i := 0; i < b.N; i++ {
var r int64 = 1
var j int64 = 0
for ; j < benchPowP; j++ {
r *= benchPowB
}
}
}

测试结果:

goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
BenchmarkQuickPow-8 357897716 3.373 ns/op
BenchmarkInnerPow-8 39162492 29.30 ns/op
BenchmarkSimpleMulti-8 121066731 9.549 ns/op
PASS
ok command-line-arguments 4.894s

从性能测试结果看,quick pow 算法比简单乘法快了好几倍,比 math.pow 快了近 10 倍。

所以,如果程序只需要求整数幂,而且能确保计算结果不会越界时,可以考虑使用 quick pow 算法代替语言内置的浮点函数。

Quick Pow: 如何快速求幂的更多相关文章

  1. 快速求幂(Quick Exponentiation)

    接触ACM没几天,向各路大神求教,听说ACM主要是研究算法,所以便开始了苦逼的算法学习之路.话不多说,RT所示,学习快速求幂. 在头文件<math.h>或是<cmath>中,d ...

  2. NYOJ--102--次方求模(快速求幂取模)

    次方求模 时间限制:1000 ms  |  内存限制:65535 KB 难度:3   描述 求a的b次方对c取余的值   输入 第一行输入一个整数n表示测试数据的组数(n<100)每组测试只有一 ...

  3. HDU 2035 人见人爱A^B(二分求幂,快速求幂)

    题意:求A的B次方的后三位数字 思路1:常规求幂,直接取余求解 代码: #include<iostream> #include<cstdio> using namespace ...

  4. [leetcode]50. Pow(x, n)求幂

    Implement pow(x, n), which calculates x raised to the power n (xn). Example 1: Input: 2.00000, 10 Ou ...

  5. ahjesus js 快速求幂

    /* 快速幂计算,传统计算方式如果幂次是100就要循环100遍求值 快速幂计算只需要循环7次即可 求x的y次方 x^y可以做如下分解 把y转换为2进制,设第n位的值为i,计算第n位的权为x^(2^(n ...

  6. NYOJ-127 快速求幂,最小生成树

    #include"iostream" using namespace std; int kuaisuqiumo(int a,int b,int c){ ; a = a % c; ) ...

  7. hdu 1005 Number Sequence(矩阵连乘+二分快速求幂)

    题目:http://acm.hdu.edu.cn/showproblem.php?pid=1005 代码: #include<iostream> #include<stdio.h&g ...

  8. 求幂&&快速幂&&位运算

    1.普通的求幂方法: 时间复杂度为O(n),对于比较大的数在1s限时内可能会TLE int pow(int base,int p){ int ans=1; for(int i=1;i<=p;i+ ...

  9. 九度OJ 1085 求root(N, k) -- 二分求幂及快速幂取模

    题目地址:http://ac.jobdu.com/problem.php?pid=1085 题目描述: N<k时,root(N,k) = N,否则,root(N,k) = root(N',k). ...

随机推荐

  1. acwing刷题-放养又没有完全放养

    题目 一个鲜为人知的事实是,奶牛拥有自己的文字:「牛文」. 牛文由 26 个字母 a 到 z 组成,但是当奶牛说牛文时,可能与我们所熟悉的 abcdefghijklmnopqrstuvwxyz 不同, ...

  2. 3.1 常用Linux命令

    1.echo命令 echo命令用于在终端设备上输出字符串或变量提取后的值,语法格式为"echo [字符串] [$变量]". 2.date命令 date命令用于显示或设置系统的时间与 ...

  3. vue动态路由实现原理 addRoute

    vue新版router.addRoute基础用法 新版Vue Router中用router.addRoute来替代原有的router.addRoutes来动态添加路由.子路由 在添加子路由的时候 比如 ...

  4. 忘记VMware vcenter的Administrator@vsphere.local密码

    忘记VMware vcenter的Administrator@vsphere.local密码的解决办法一. 重置密码:ssh root@192.168.230.100Connecting to 192 ...

  5. Linux学习教程 | 全文目录

    本教程最大的特点是通俗易懂,并且非常详细,花费 7 天时间即可快速了解 Linux. 第一章 Linux简介 1.1 操作系统是什么,操作系统概述 1.2 Linux是什么,有哪些特点? 1.3 Li ...

  6. 羽夏 MakeFile 简明教程

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.该文章根据 GNU Make Manual 进行汉化处理并作出自己的整理,一是我对 Make 的学习记录,二是对大家学习 MakeF ...

  7. 什么叫做 SSO

    什么叫做 SSO 本文写于 2020 年 12 月 8 日 SSO 的全称叫做 Single Sign On,意味「单点登录」. 何为单点登录?就是你希望自己的两个网站,可以做到:一个网站登录了,另一 ...

  8. 905. Sort Array By Parity - LeetCode

    Question 905. Sort Array By Parity Solution 题目大意:数组排序,偶数放前,奇数在后,偶数的数之间不用管顺序,奇数的数之间也不用管顺序 思路:建两个list, ...

  9. Hadoop安装学习(第二天)

    学习任务: 1.对VMnet8进行设置 2.配置主机名,对host文件进行编辑 3.将Hadoop文件以及jdk通过Xshell7传输到Linux系统 4.设置免密登录

  10. 基于surging网络组件多协议适配的平台化发展

    前言                Surging 发展已经有快6年的时间,经过这些年的发展,功能框架也趋于成熟,但是针对于商业化需求还需要不断的打磨,前段时间客户找到我想升级成平台化,针对他的需求我 ...