今天讲个有趣的算法:如何快速求 \(n^m\),其中 n 和 m 都是整数。

为方便起见,此处假设 m >= 0,对于 m < 0 的情况,求出 \(n^{|m|}\) 后再取倒数即可。

另外此处暂不考虑结果越界的情况(超过 int64 范围)。

当然不能用编程语言的内置函数,我们只能用加减乘除来实现。

n 的 m 次方的数学含义是:m 个 n 相乘:n*n*n...*n,也就是说最简单的方式是执行 m 次乘法。

直接用乘法实现的问题是性能不高,其时间复杂度是 O(m),比如 \(3^{29}\) 要执行 29 次乘法,而乘法运算是相对比较重的,我们看看能否采用什么方法将时间复杂度降低。

设 m = x + y + z(x、y、z 都是整数),我们知道有如下数学等式: \(n^m\) = \(n^{x+y+z}\) = \(n^x * n^y * n^z\)。

也就是说,如果我们已经知道 \(n^x\)、\(n^y\)、\(n^z\) 的值,是不是就可以直接用他们相乘得出 \(n^m\)的结果?这样的话乘的次数就大大降低了。

于是问题就变成应该将 m 拆成怎样的几个数的和。

因为计算机是玩二进制的,我们尝试着将这些数跟 2 扯上联系(以 2 为底),看看会不会有奇迹发生。

我们看看具体的例子:\(3^{29}\)。

我们将 29 做这样的拆分:29 = 16 + 8 + 4 + 1。

这个拆分有什么特点呢?右边的数都是 2 的 X 次方(\(2^4 + 2^3 + 2^2 + 2^0\))。

我们把上面的拆分带进公式:\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\)。

那我们能不能知道 \(3^{16}\)、\(3^{8}\)、\(3^{4}\)、\(3^{1}\) 是什么呢?

我们不用计算就知道 \(3^{1}\) 是什么——但仅此而已。

不过我们可以用 \(3^{1}\) 自乘 4 次的到 \(3^4\);然后再用 \(3^4\) 自乘得到 \(3^8\);再通过 \(3^8\) 自乘得到 \(3^{16}\)。

好像有点感觉了——我们每做一次乘法,就能将结果翻倍(如 \(3^4\) 自乘就变成 \(3^4*3^4 = 3^8\))。

如此,虽然也要多次乘法,但乘的次数从 29 次降到 9 次!

然后我们再回头看看上面的拆分:

29 = 16 + 8 + 4 + 1 = \(2^4 + 2^3 + 2^2 + 2^0\) = \(1*2^4 + 1*2^3 + 1*2^2 + 0*2^1 + 1*2^0\) 。

这不就是学校学的二进制转十进制吗(29 的二进制是 11101)?

\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\) 是说:取 29 的二进制表示中所有值是 1 的位,算出它们的指数值并相乘就得到最终的值。

我们用 go 语言实现一下:

// 求 a 的 n 次方
// a、n 是非负整数
func Pow(a,n int64) int64 {
// 0 的任何次方都是 0
if a == 0 {
return 0
} // 任何数的 0 次方都是 1
if n == 0 {
return 1
} // 1 次方是它自身
if n == 1 {
return a
} // 用滚雪球的方式计算幂
// 雪球初始值是 1
var result int64 = 1
// 滚动因子初始化为 a 的 1 次方(a 自身)
factor := a
// 循环处理直到 n 变成 0(所有的二进制位都处理完了)
for n != 0 {
// 跟 1 做与运算,判断当前要处理的位是不是 1
// 之所以是直接跟 1 做与运算,因为后面每处理一轮都将 n 右移了一位,保证每次要处理的位都在最低位
if n & 1 != 0 {
// 当前位是 1,需要乘进去
result *= factor
}
// 每轮结束时将滚动因子自乘
// 因为每行进一轮,指数都翻倍,整体结果就是自乘
// 比如本轮因子是 2**4,下一轮就是 2**8
// 2**8 = 2**(4+4) = 2**4 * 2**4
// (** 表示指数)
factor *= factor
// n 右移一位,将下一轮要处理的位放在最低位
n = n >> 1
} return result
}

有什么用呢?

很多语言内置的 pow 函数都只接受浮点数,浮点数的运算是非常重的,如果我们的程序需要频繁计算整数的幂,就可以采用 quick pow 算法代替语言内置的幂函数以提升性能。

我们对 go 语言内置的 math.Pow 和 quick pow 算法做个性能测试对比一下。

// 测试 3 的 29 次方的性能测试
var benchPowB int64 = 3
var benchPowP int64 = 29 // 上面的 quick pow 算法
func BenchmarkQuickPow(b *testing.B) {
for i := 0; i < b.N; i++ {
algo.Pow(benchPowB, benchPowP)
}
} // go 语言 math 包的 Pow 方法,只接受 float64 类型
func BenchmarkInnerPow(b *testing.B) {
x := float64(benchPowB)
y := float64(benchPowP)
for i := 0; i < b.N; i++ {
math.Pow(x, y)
}
} // 用简单乘法实现(3 自乘 29 次)
func BenchmarkSimpleMulti(b *testing.B) {
for i := 0; i < b.N; i++ {
var r int64 = 1
var j int64 = 0
for ; j < benchPowP; j++ {
r *= benchPowB
}
}
}

测试结果:

goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
BenchmarkQuickPow-8 357897716 3.373 ns/op
BenchmarkInnerPow-8 39162492 29.30 ns/op
BenchmarkSimpleMulti-8 121066731 9.549 ns/op
PASS
ok command-line-arguments 4.894s

从性能测试结果看,quick pow 算法比简单乘法快了好几倍,比 math.pow 快了近 10 倍。

所以,如果程序只需要求整数幂,而且能确保计算结果不会越界时,可以考虑使用 quick pow 算法代替语言内置的浮点函数。

Quick Pow: 如何快速求幂的更多相关文章

  1. 快速求幂(Quick Exponentiation)

    接触ACM没几天,向各路大神求教,听说ACM主要是研究算法,所以便开始了苦逼的算法学习之路.话不多说,RT所示,学习快速求幂. 在头文件<math.h>或是<cmath>中,d ...

  2. NYOJ--102--次方求模(快速求幂取模)

    次方求模 时间限制:1000 ms  |  内存限制:65535 KB 难度:3   描述 求a的b次方对c取余的值   输入 第一行输入一个整数n表示测试数据的组数(n<100)每组测试只有一 ...

  3. HDU 2035 人见人爱A^B(二分求幂,快速求幂)

    题意:求A的B次方的后三位数字 思路1:常规求幂,直接取余求解 代码: #include<iostream> #include<cstdio> using namespace ...

  4. [leetcode]50. Pow(x, n)求幂

    Implement pow(x, n), which calculates x raised to the power n (xn). Example 1: Input: 2.00000, 10 Ou ...

  5. ahjesus js 快速求幂

    /* 快速幂计算,传统计算方式如果幂次是100就要循环100遍求值 快速幂计算只需要循环7次即可 求x的y次方 x^y可以做如下分解 把y转换为2进制,设第n位的值为i,计算第n位的权为x^(2^(n ...

  6. NYOJ-127 快速求幂,最小生成树

    #include"iostream" using namespace std; int kuaisuqiumo(int a,int b,int c){ ; a = a % c; ) ...

  7. hdu 1005 Number Sequence(矩阵连乘+二分快速求幂)

    题目:http://acm.hdu.edu.cn/showproblem.php?pid=1005 代码: #include<iostream> #include<stdio.h&g ...

  8. 求幂&&快速幂&&位运算

    1.普通的求幂方法: 时间复杂度为O(n),对于比较大的数在1s限时内可能会TLE int pow(int base,int p){ int ans=1; for(int i=1;i<=p;i+ ...

  9. 九度OJ 1085 求root(N, k) -- 二分求幂及快速幂取模

    题目地址:http://ac.jobdu.com/problem.php?pid=1085 题目描述: N<k时,root(N,k) = N,否则,root(N,k) = root(N',k). ...

随机推荐

  1. B - Weird Game (博弈论), cf1500

    拉题链接  https://vjudge.net/contest/430219#overview 原题链接  https://codeforces.com/problemset/problem/299 ...

  2. 2021.08.16 P1078 文化之旅(最短路)

    2021.08.16 P1078 文化之旅(最短路) 题意: n个地,k个信仰,每个地都有自己的信仰,信仰之间会相互排斥,同信仰之间也会相互排斥,有m条路,问从s到t的最短距离是多少? 有一位使者要游 ...

  3. SQL Server 2019安装 Developer 版

    1.打开微软官方下载网站https://www.microsoft.com/zh-CN/sql-server/sql-server-downloads 2.双击打开下载的文件,等待下载完成 3. 选择 ...

  4. 如何实现 antd table 自动调整可视高度(纵向滚动条,scrollY)

    一.事情的起因 最近在做的项目中有大量的表格,正常的表格高度是没有限制的,数据量很大的时候会出现表格内容以及分页信息超出可视窗口, 为了查看超出的部分就需要滚动页面但是这样就会把查询条件等信息滚出可视 ...

  5. 【面试普通人VS高手系列】请说一下你对分布式锁的理解,以及分布式锁的实现

    一个工作了7年的Java程序员,私信我关于分布式锁的问题. 一上来就两个灵魂拷问: Redis锁超时怎么办? Redis主从切换导致锁失效怎么办? 我说,别着急,这些都是小问题. 那么,关于" ...

  6. 【openstack】cloudkitty组件,入门级安装(快速)

    @ 目录 前言 架构 安装 配置 启动 检索并安装 CloudKitty 的仪表板 前言 什么是CloudKitty? CloudKitty是OpenStack等的评级即服务项目.该项目旨在成为云的退 ...

  7. Linux 环境变量配置的 6 种方法,建议收藏

    关注「开源Linux」,选择"设为星标" 回复「学习」,有我为您特别筛选的学习资料~ Linux环境变量配置 在自定义安装软件的时候,经常需要配置环境变量,下面列举出各种对环境变量 ...

  8. 常用的Linux 系统备份、恢复命令

    公众号关注 「开源Linux」 回复「学习」,有我为您特别筛选的学习资料~ 删库跑路的事常常听说,不过,这只能是个调侃的话题,真正的工作中可不能这么干,否则,库是删了,路怕是跑不了了. 所以,备份很重 ...

  9. OpenStack计费服务

    cloudkitty服务介绍 当前版本cloudkitty可以完成虚拟机实例(compute),云硬盘(volume),镜像(image),网络进出流量(network.bw.in,network.b ...

  10. QY-16 浮标水质监测站 组成 及基础参数是什么?一文认识什么是浮标水质监测站

    浮标水质监测站是设立在河流.湖泊.水库.近岸海域等流 域内的现场水质自动监测实验室,是以水质监测仪为核心,运用 传感器技术,结合浮标体.电源供电系统.数据传输设备组成的 放置于水域内的小型水质监测系统 ...