快速幂算法可以说是ACM一类竞赛中必不可少,并且也是非常基础的一类算法,鉴于我一直学的比较零散,所以今天用这个帖子总结一下

快速乘法通常有两类应用:一、整数的运算,计算(a*b) mod c  二、矩阵快速乘法

一、整数运算:(快速乘法、快速幂)

先说明一下基本的数学常识:

(a*b) mod c == ( (a mod c) * (b mod c) ) mod c //这最后一个mod c 是为了保证结果不超过c

对于2进制,2n可用1后接n个0来表示、对于8进制,可用公式 i+3*j == n (其中 0<= i <=2 ),对于16进制,可用 i+4*j==n(0 <= i <=3)来推算,表达形式为2i 后接 j 个0。

接下来让我们尽可能简单的描述快速乘法的思想:

a*b

快速乘法的基本思想 ,是二进制和乘法分配律的结合,(不由得想起浮点数不满足结合律,严重吐槽!!!╮(╯-╰)╭),比如说,13 ==(1101)2  ,4*13等于4*(1101)2 ,用分配律展开得到4*13 == 4*(1000+100+1)2,我们不难观察出,快速幂可以通过判断当前的位(bit)是1还是0,推断出是否需要做求和操作,每次移动到下一位(bit)时,就对ans进行*2操作,等待是否求和。由于除以2和位移操作是等效的,因此这也可以看作是二分思想的应用,这种算法将b进行二分从而减少了不必要的运算,时间复杂度是log(n)。

a^b

快速幂其实可以看作是快速乘法的特例,在快速幂中,我们不再对ans进行*2操作,因为在a^b中b的意义已经从乘数变成了指数,但是我们可以仍然把b写成二进制,举例说明:此时,我们将4*13改为4^13,13=(1101)2 ,二进制13写开我们得到(1000+100+1),注意,这里的所有二进制是指数,指数的相加意味着底数相乘,因此有4^13 == 48 * 44 * 41。再注意到指数之间的2倍关系,我们就可以用很少的几个变量,完成这一算法。这样,我们就将原本用循环需要O(n)的算法,改进为O(logN)的算法。

按照惯例,给出尽可能简洁高效的代码实现 (以下所有int都可用long long 代替)

首先,给出快速乘法的实现:

 //快速乘法
int qmul(int a,int b){// 根据数据范围可选择long long
int ans=;
while(b){
if( b&)ans+=a;//按位与完成位数为1的判断
b>>=;a<<=;//位运算代替/2和*2
}
return ans;
}

如果涉及到快速乘法取模,则需要进行一些微小改动

改动所基于的数学原理,请参考红色字体标出的数学常识

 //快速乘法取模
int qmul_mod(int a,int b,int mod){
int ans=;
while(b){
if((b%=mod)&)ans+=a%=mod;//这里需要b%=mod 以及a%=mod
b>>=;a<<=;
}
return ans%mod; //ans也需要对mod取模
}

接下来是快速幂的实现:

 //快速幂 a^b
int qpow(int a,int b){
if(a==)return ;//这是个坑,校赛被坑过,很多网上的实现都没写这一点
int ans=;
while(b){
if(b&)ans*=a;//和快速乘法的区别
b>>=;a*=a;//区别,同上
}
return ans;
}

以及含有取模的快速幂:

int qpow_mod(int a,int b,int mod){
if(a==)return ;
int ans=;
while(b){
if(b&)ans=(ans%mod)*(a%mod);//如果确定数据不会爆的话,可写成 ans*=a%=mod;
b>>=;a*=a%=mod;//等价于a=(a%mod)*(a%mod),且将一个模运算通过赋值代替,提高了效率
}
return ans%mod;//数据不会爆的话,这里的%运算会等价于第5中不断重复的 ans%mod
}

如果我们对于性能还有更进一步的要求,那么也就是减少取模运算了,那么我们需要确定数据范围不会爆掉

在这样的前提下,我们可以只用原先1/4的取模运算量完成快速幂

int qpow_mod(int a,int b,int mod){
if(!a)return ;
int ans=;
while(b){
if(b&)ans*=a%=mod;//这里的模运算只有一个
b>>=;a*=a;//这里的模运算没有了
}
return ans%mod;
}

这些天找了好久,终于找到了纯粹的整数快速幂题目,按照惯例,给一波传送门:

poj1995:http://poj.org/problem?id=1995

这个题。。。没什么好说的,但是需要注意,用1/4模运算量的那种写法,数据会爆,所以必须写成完全取模的运算,这样程序会慢一点。。。呜呜呜,63ms水过,这是目前我做的最慢的了,如果大神知道如何在16ms及以下A掉它,欢迎联系我谢谢~o(* ̄▽ ̄*)ブ

实现的代码如下:

 #include<cstdio>
int z,a,b,m,h,sum;
int qpow_mod(int a,int b,int mod){
if(!a)return ;
int ans=;
while(b){
if(b&)ans=ans%mod*(a%=mod);
b>>=;a=a%mod*(a%mod);
}
return ans%mod;
}
int main(){
scanf("%d",&z);
while(z--){
scanf("%d%d",&m,&h);sum=;
while(h--){
scanf("%d%d",&a,&b);
sum+=qpow_mod(a,b,m);
sum%=m;
}
printf("%d\n",sum);
}
}

先更新到这,有时间再更新矩阵的Strassen算法以及矩阵快速幂,,大家稍后见(●'◡'●)

2016-06-13 16:47:56

大家好,我又回来啦

二、矩阵运算:(快速幂)(Strassen算法有空再说)

矩阵的快速幂运算,其实思路和上面的整数快速幂是一样的,对指数进行二分,不过我们对于快速幂本身,可能既可以写成函数,也可以写成运算符重载,所以这里我写的是运算符的重载,毕竟重载练得少,得多练一练

首先我们可以定义一个矩阵数据结构,也可以直接用二维数组

 #define N 100
struct matrix{
int m[N][N];
};

然后我们重载^运算符,完成矩阵m的b次幂的快速幂运算

这里为了我自己代码习惯,我重载了*和*=两种运算符,当然,在写的时候跪在了忘了写函数声明上,毕竟C++不是java,对于函数声明的顺序有依赖,so~大家记得写函数声明呦

代码如下

 //矩阵的数据结构
struct matrix{
int m[N][N];
};
matrix operator * (matrix ,matrix);//重载声明
matrix operator *= (matrix,matrix);
matrix operator ^ (matrix a,int b){
matrix ans;
for(int i=;i<N;i++)
for(int j=;j<N;j++)ans.m[i][j]=(i==j);//初始化为单位矩阵
if(b&)ans*=a;
b>>=;a*=a;
return ans;
}
matrix operator * (const matrix a,const matrix b){//朴素矩阵乘法
matrix ans;
for(int i=;i<N;i++)
for(int j=;j<N;j++)
for(int k=;k<N;k++)
ans.m[i][j]=a.m[i][k]+b.m[k][j];
return ans;
}
matrix operator *= (matrix a,const matrix b){
return a=b*b;
}

当然,有必要的时候,我会再更新一波Strassen算法,考虑到在很多情况下,Strassen算法反而会降低矩阵运算的速度,所以我们就先到这里~拜拜(●ˇ∀ˇ●)

整数快速乘法/快速幂+矩阵快速幂+Strassen算法的更多相关文章

  1. 矩阵乘法&矩阵快速幂&矩阵快速幂解决线性递推式

    矩阵乘法,顾名思义矩阵与矩阵相乘, 两矩阵可相乘的前提:第一个矩阵的行与第二个矩阵的列相等 相乘原则: a b     *     A B   =   a*A+b*C  a*c+b*D c d     ...

  2. 快速幂 & 矩阵快速幂

    目录 快速幂 实数快速幂 矩阵快速幂 快速幂 实数快速幂 普通求幂的方法为 O(n) .在一些要求比较严格的题目上很有可能会超时.所以下面来介绍一下快速幂. 快速幂的思想其实是将数分解,即a^b可以分 ...

  3. 【数论】 快速幂&&矩阵快速幂

    首先复习快速幂 #include<bits/stdc++.h> using namespace std; long long power(long long a,long long b,l ...

  4. 快速幂&&矩阵快速幂

    快速幂 题目链接:https://www.luogu.org/problemnew/show/P1226 快速幂用了二分的思想,即将\(a^{b}\)的指数b不断分解成二进制的形式,然后相乘累加起来, ...

  5. hdu 4549 M斐波那契数列(快速幂 矩阵快速幂 费马小定理)

    题目链接http://acm.hdu.edu.cn/showproblem.php?pid=4549: 题目是中文的很容易理解吧.可一开始我把题目看错了,这毛病哈哈. 一开始我看错题时,就用了一个快速 ...

  6. jiulianhuan 快速幂--矩阵快速幂

    题目信息: 1471: Jiulianhuan 时间限制: 1 Sec  内存限制: 128 MB 提交: 95  解决: 22 题目描述 For each data set in the input ...

  7. [板子]快速幂&矩阵快速幂

    不会的来这看:https://www.cnblogs.com/CXCXCXC/p/4641812.html 简单的一说:当转换为二进制的时候有位运算这种黑科技,&相当于%2判断奇偶性. x&a ...

  8. 培训补坑(day10:双指针扫描+矩阵快速幂)

    这是一个神奇的课题,其实我觉得用一个词来形容这个算法挺合适的:暴力. 是啊,就是循环+暴力.没什么难的... 先来看一道裸题. 那么对于这道题,显然我们的暴力算法就是枚举区间的左右端点,然后通过前缀和 ...

  9. 矩阵快速幂模板(pascal)

    洛谷P3390 题目背景 矩阵快速幂 题目描述 给定n*n的矩阵A,求A^k 输入输出格式 输入格式: 第一行,n,k 第2至n+1行,每行n个数,第i+1行第j个数表示矩阵第i行第j列的元素 输出格 ...

随机推荐

  1. Luogu2737 USACO4.1麦香牛块(动态规划)

    小凯的疑惑升级版.只有两个数的话不能表示的最大数是ab-a-b,显然如果可选数增加不会比这更大,所以只要答案存在一定小于256*256-2*256.在这个范围内背包即可. #include<io ...

  2. [BZOJ5417] [NOI2018]你的名字

    Description 小A 被选为了ION2018 的出题人,他精心准备了一道质量十分高的题目,且已经把除了题目命名以外的工作都做好了. 由于ION 已经举办了很多届,所以在题目命名上也是有规定的, ...

  3. [POI2007]ATR-Tourist Attractions

    题目大意:一个无向图,从$1$到$n$,要求必须经过$2,3,\dots,k+1$,给出一些限制关系,要求在经过$v\leq k+1$之前必须经过$u\leq k+1$,求最短路 题解:预处理出$1\ ...

  4. [Leetcode] word break 拆分词语

    Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separa ...

  5. BZOJ3573 [Hnoi2014]米特运输 【贪心】

    题目链接 BZOJ3573 题解 题目又臭又长系列 题意:修改尽量少的点权,使得: ①同个节点的所有儿子点权相同 ②任意非叶节点权值等于其儿子权值之和 容易发现一旦任意一个点权值确定,整棵树权值就确定 ...

  6. 使用setTimeout延时10ms执行onunloadcancel

    在做Web开发时,我们经常用到页面关闭事件onbeforeunload,可以给用户一个选择放弃关闭的机会,就比如这个博客编辑器.如果用户选择了离开,那么onunload事件自然会触发:但若用户选择了取 ...

  7. 如何把阿里云的服务器配置为mac的共享文件夹(亲测有效)

    写在开头的就是,我只能百分之九十确定这个是真的有效....毕竟试了太多的方法,最后莫名其妙的就好了.. - -# 基础的步骤就不说了,网上一搜一大把,大家可能follow了所有的步骤以后发现还是连接不 ...

  8. 用spring的@Validated注解和org.hibernate.validator.constraints.*的一些注解在后台完成数据校验

    这个demo主要是让spring的@Validated注解和hibernate支持JSR数据校验的一些注解结合起来,完成数据校验.这个demo用的是springboot. 首先domain对象Foo的 ...

  9. es6+最佳入门实践(11)

    11.async函数 async 函数是什么?一句话,它就是 Generator 函数的语法糖.通俗的说就是Generator函数的另一种写法,这种写法更简洁,除此之外,async函数还对Genrat ...

  10. Lucene4.6 把时间信息写入倒排索引的Offset偏移量中,并实现按时间位置查询

    有个新的技术需求,需要对Lucene4.x的源码进行扩展,把如下的有时间位置的文本写入倒排索引,为此,我扩展了一个TimeTokenizer分词器,在这个分词器里将时间信息写入 偏移量Offset中. ...