浅谈FFT&NTT
复数及单位根
复数的定义大概就是:\(i^2=-1\),其中\(i\)就是虚数单位。
那么,在复数意义下,对于方程:
\]
就必定有\(n\)个解,这\(n\)个解的分布一定是在复平面上,以圆点为圆心,半径为\(1\)的圆的\(n\)等分点。
由于欧拉公式:
\]
把\(2\pi\)带入:
\]
比较一下这个和上面的方程,设:
\]
那么可以得到上面方程的\(n\)个解分别为:
\]
那么,我们称这\(n\)个解为\(n\)次单位根。
关于单位根,有以下性质:
\]
这些性质的证明都很简单。
点值表达式
考虑到,一个多项式可以看做是一个\(n\)次的函数,如果已知这个函数的\(n+1\)个点,那么就可以确定这个多项式。
任取\(n+1\)个不同的数\(x_i\),知道了多项式的结果\(F(x_i)\),这个称作多项式的点值表达式。
离散傅里叶变换(Discrete Fourier Transform, DFT)
对于一个\(n-1\)次多项式,取\(n\)个数\(w_n^0,w_n^1...w_n^{n-1}\),得到一个点值表达式,称作离散傅里叶变换。
先把这个多项式凑成\(n=2^x\)的形式,高位补\(0\)。
对于\(F(\omega_n^{k})\),显然可以得到:
\]
其中\(A_i\)为系数。
然后对这个进行奇偶分类,可得:
F(\omega_n^k)&=\sum_{i=0}^{n/2-1}(\omega_n^{k})^{2i}\cdot A_{2i}+\sum_{i=0}^{n/2-1}(\omega_n^k)^{2i+1}\cdot A_{2i+1}\\
&=\sum_{i=0}^{n/2-1}(\omega_{n/2}^{k})^i\cdot A_{2i}+\omega_n^k\cdot \sum_{i=0}^{n/2-1}(\omega_{n/2}^k)^{i}\cdot A_{2i+1}
\end{align}
\]
设\(F_0(x)\)为偶数项的系数构成的多项式,\(F_1(x)\)为奇数项,这个显然是一个子问题。
那么:
\]
所以,令\(k\leqslant n/2\),则有:
\]
即:
\\F(\omega_n^{k+n/2})=F_0(\omega_{n/2}^k)-w_n^{k}\cdot F_1(\omega_{n/2}^k)
\]
递归计算即可,复杂度:
\]
离散傅里叶逆变换(Inverse Discrete Fourier Transform, IDFT)
对于离散傅里叶变换,写成矩阵的形式就是:
(\omega_n^0)^0&(\omega_n^0)^1&\cdots & (\omega_n^0)^{n-1}\\
(\omega_n^1)^0&(\omega_n^1)^1&\cdots & (\omega_n^1)^{n-1}\\
\vdots&\vdots&\ddots&\vdots\\
(\omega_n^{n-1})^0&(\omega_n^{n-1})^1&\cdots & (\omega_n^{n-1})^{n-1}\\
\end{bmatrix}
\times
\begin{bmatrix}
A_0\\A_1\\\vdots\\A_{n-1}
\end{bmatrix}
=
\begin{bmatrix}
F(\omega_n^0)\\F(\omega_n^1)\\\vdots\\F(\omega_n^{n-1})
\end{bmatrix}
\]
现在,我们是知道了等号右边的\(F\),要求等号左边的\(A\)。
设上面的系数矩阵为\(s\),考虑下面这个矩阵,设为\(t\)。
(\omega_n^{-0})^0&(\omega_n^{-0})^1&\cdots & (\omega_n^{-0})^{n-1}\\
(\omega_n^{-1})^0&(\omega_n^{-1})^1&\cdots & (\omega_n^{-1})^{n-1}\\
\vdots&\vdots&\ddots&\vdots\\
(\omega_n^{-(n-1)})^0&(\omega_n^{-(n-1)})^1&\cdots & (\omega_n^{-(n-1)})^{n-1}\\
\end{bmatrix}
\]
考虑矩阵\(v=t\times s\):
对于\(v_{i,j}\),根据矩阵乘法规则,它会等于:
\]
若\(i=j\),则:
\]
否则:
\]
注意到:
\]
所以:
\]
然后把这个矩阵写出来:
n&0&\cdots&0\\
0&n&\cdots&0\\
\vdots&\vdots&\ddots&\vdots\\
0&0&\cdots&n
\end{bmatrix}
\]
然后可以发现,这个就是单位矩阵的\(n\)倍,即:
\]
然后考虑第一个矩阵的式子,等式两边同时左乘一个\(t\),可得:
\begin{bmatrix}
A_0\\A_1\\\vdots\\A_{n-1}
\end{bmatrix}
=
\begin{bmatrix}
(\omega_n^{-0})^0&(\omega_n^{-0})^1&\cdots & (\omega_n^{-0})^{n-1}\\
(\omega_n^{-1})^0&(\omega_n^{-1})^1&\cdots & (\omega_n^{-1})^{n-1}\\
\vdots&\vdots&\ddots&\vdots\\
(\omega_n^{-(n-1)})^0&(\omega_n^{-(n-1)})^1&\cdots & (\omega_n^{-(n-1)})^{n-1}\\
\end{bmatrix}
\times
\begin{bmatrix}
F(\omega_n^0)\\F(\omega_n^1)\\\vdots\\F(\omega_n^{n-1})
\end{bmatrix}
\]
所以,\(IDFT\)的时候直接照搬\(DFT\),然后把\(\omega_n^k\)改成\(\omega_n^{-k}\),最后在除个\(n\)就好了。
迭代实现
由于上面的递归实现常数过大,不是很优秀,这里有一种迭代的实现方法。
考虑我们把递归过程改成迭代,那么显然我们需要把顺序重新排列一下,然后每次把相邻的\(2^k\)个数合并就好了。
令\(n=2^m\),考虑第\(i\)次递归的时候,二进制下第\(i\)为\(0\)的放左边,为\(1\)的放右边,那么可以发现,左边的所有数新位置的编号第\(m-i+1\)位都为\(0\),右边的为\(1\),这个可以自己画下图理解下。
那么,设\(rev(x)\)表示把\(x\)的二进制翻转的结果,即第\(i\)位和第\(m-i+1\)位交换。
对于原序列第\(i\)个数,他在新序列的位置就应该是\(rev(i)\)。
代码就比较好写了:
#include<cmath>
#include<cstdio>
#include<iostream>
#include<algorithm>
using namespace std;
void read(int &x) {
x=0;int f=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar()) if(ch=='-') f=-f;
for(;isdigit(ch);ch=getchar()) x=x*10+ch-'0';x*=f;
}
void print(int x) {
if(x<0) putchar('-'),x=-x;
if(!x) return ;print(x/10),putchar(x%10+48);
}
void write(int x) {if(!x) putchar('0');else print(x);putchar('\n');}
const int maxn = 4e6+10;
#define lf double
const lf pi = acos(-1);
struct complex {
lf real,imag;
complex () {}
complex (lf _real,lf _imag) {real=_real,imag=_imag;}
complex conj() {return complex(real,-imag);} //共轭复数
complex operator = (const int &rhs) {real=rhs;return *this;}
complex operator + (const complex &rhs) const {return complex(real+rhs.real,imag+rhs.imag);}
complex operator - (const complex &rhs) const {return complex(real-rhs.real,imag-rhs.imag);}
complex operator * (const complex &rhs) const {return complex(real*rhs.real-imag*rhs.imag,imag*rhs.real+real*rhs.imag);}
}; //手写的一个复数类
complex es[maxn],ces[maxn],a[maxn],b[maxn];
int n,m,N,pos[maxn],bit;
void init() {
for(int i=0;i<N;i++) es[i]=complex(cos(2*pi/N*i),sin(2*pi/N*i));
for(int i=0;i<N;i++) ces[i]=es[i].conj(); //预处理单位根
for(int i=1;i<N;i++) pos[i]=pos[i>>1]>>1|((i&1)<<(bit-1)); //pos[x]表示rev(x)
}
void fft(complex *r,complex *w) {
for(int i=0;i<N;i++) if(pos[i]>i) swap(r[i],r[pos[i]]); //调整位置
for(int i=1;i<N;i<<=1)
for(int j=0;j<N;j+=(i<<1))
for(int k=0;k<i;k++) {
complex x=r[j+k],y=w[N/(i<<1)*k]*r[j+k+i]; //迭代实现
r[j+k]=x+y,r[i+j+k]=x-y;
}
}
int main() {
read(n),read(m);
for(int i=0,x;i<=n;i++) read(x),a[i]=x;
for(int i=0,x;i<=m;i++) read(x),b[i]=x;
N=1;while(N<=n+m) N<<=1,bit++;
init();fft(a,es),fft(b,es);
for(int i=0;i<=N;i++) a[i]=a[i]*b[i];fft(a,ces);
for(int i=0;i<=n+m;i++) printf("%d ",(int)(a[i].real/N+0.5));puts(""); //记得答案要除N,这个其实应该写在fft函数里面。。
return 0;
}
这份代码在洛谷的模板P3803 【模板】多项式乘法(FFT)提交可以通过。
快速数论变换(Fast Number-Theoretic Transform,FNT)
这玩意其实一般叫做\(NTT\)。
考虑到上面\(FFT\)的过程用到了单位根的哪些性质:
- \(\omega_n^0,\omega_n^1...\omega_n^{n-1}\)互不相同,这保证了点值表达式可以成立。
- \(\omega_n^2=\omega_{n/2}\),\(\omega_n^{k+n/2}=-\omega_n^k\)。
- \(\omega_n^n=1\),这保证了IDFT的正确性。
对于模数\(p=k\cdot 2^s+1\),且\(p\)为质数,设它的原根为\(g\),那么我们可以令\(\omega_n=g^{(p-1)/n}\)。
由于原根的性质,第一条显然是满足的。
对于第二条:
\]
并且:
\]
也比较显然。
对于第三点,其实就是费马小定理,显然满足,所以我们可以用这个来替代\(\omega_n\),进行数论变换,代码也差不多。
注意,对于质数\(p=k\cdot 2^s+1\),它能处理的数据范围是\(n\leqslant 2^s\)。
模板:题目和上题相同
#include<bits/stdc++.h>
using namespace std;
void read(int &x) {
x=0;int f=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar()) if(ch=='-') f=-f;
for(;isdigit(ch);ch=getchar()) x=x*10+ch-'0';x*=f;
}
void print(int x) {
if(x<0) putchar('-'),x=-x;
if(!x) return ;print(x/10),putchar(x%10+48);
}
void write(int x) {if(!x) putchar('0');else print(x);putchar('\n');}
const int maxn = 4e6+10;
const int mod = 998244353;
int n,m,N=1,bit,pos[maxn],es[maxn],ces[maxn],a[maxn],b[maxn];
int qpow(int aa,int x) {
int res=1;
for(;x;x>>=1,aa=1ll*aa*aa%mod) if(x&1) res=1ll*res*aa%mod;
return res;
}
void ntt(int *r,int f) {
for(int i=0;i<N;i++) if(pos[i]>i) swap(r[i],r[pos[i]]);
for(int i=1;i<N;i<<=1) {
int wn=qpow(f==1?3:qpow(3,mod-2),(mod-1)/(i<<1));
for(int j=0,w=1;j<N;j+=(i<<1),w=1)
for(int k=0;k<i;k++,w=1ll*w*wn%mod) {
int x=r[j+k],y=1ll*w*r[i+j+k]%mod;
r[j+k]=(x+y)%mod,r[i+j+k]=(x-y)%mod;
}
}
}
int main() {
read(n),read(m);
for(int i=0;i<=n;i++) read(a[i]);
for(int i=0;i<=m;i++) read(b[i]);
while(N<=n+m) N<<=1,bit++;
for(int i=0;i<N;i++) pos[i]=pos[i>>1]>>1|((i&1)<<(bit-1));
ntt(a,1),ntt(b,1);
for(int i=0;i<=N;i++) a[i]=1ll*a[i]*b[i]%mod;
ntt(a,-1);int inv=qpow(N,mod-2);
for(int i=0;i<=n+m;i++) printf("%d ",((1ll*a[i]*inv%mod)+mod)%mod);puts("");
return 0;
}
任意模数NTT(MTT)
设现在要算的是多项式\(A\times B\),模数可能不满足\(p=k\cdot 2^s+1\),甚至可以不是个质数。
如果直接\(FFT\)的话,显然会爆精度,现在考虑如何优化精度。
设\(r=\lceil\sqrt{p}\rceil\),那么对于多项式的每一项,设系数为\(s\),显然可以写成\(s=a\cdot r+b\)的形式。.
那么对于\(s\cdot t\),设\(s=a\cdot r+b,t=c\cdot r+d\),那么\(s\cdot t=ac\cdot r^2+(ad+bc)\cdot r+bd\)。
所以,可以把一个多项式拆成两个,分别做\(FFT\),这样精度一般是不会爆的。
然后正反一共做\(8\)遍\(FFT\)就好了。
好像有只需要做4遍FFT的方法,以后填坑。。
代码:题目出自【模板】任意模数NTT
#include<cmath>
#include<cstdio>
#include<iostream>
#include<algorithm>
using namespace std;
void read(int &x) {
x=0;int f=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar()) if(ch=='-') f=-f;
for(;isdigit(ch);ch=getchar()) x=x*10+ch-'0';x*=f;
}
void print(int x) {
if(x<0) putchar('-'),x=-x;
if(!x) return ;print(x/10),putchar(x%10+48);
}
void write(int x) {if(!x) putchar('0');else print(x);putchar('\n');}
#define lf double
const int maxn = 4e5+10;
typedef long long ll;
struct complex {
lf r,i;
complex () {}
complex (lf _r,lf _i) {r=_r,i=_i;}
complex conj() {return complex(r,-i);}
complex operator = (const int &rhs) {r=rhs;return *this;}
complex operator - (const complex &rhs) const {return complex(r-rhs.r,i-rhs.i);}
complex operator + (const complex &rhs) const {return complex(r+rhs.r,i+rhs.i);}
complex operator * (const complex &rhs) const {return complex(r*rhs.r-i*rhs.i,r*rhs.i+i*rhs.r);}
}w1[maxn],w2[maxn],a[maxn],b[maxn],c[maxn],d[maxn];
int N,bit,n,m,s[maxn],t[maxn],mod,p,ans[maxn],pos[maxn];
const lf pi = acos(-1);
void init() {
N=1,bit=0;while(N<=n+m) N<<=1,bit++;
for(int i=0;i<N;i++) pos[i]=pos[i>>1]>>1|((i&1)<<(bit-1));
w1[0]=1;for(int i=1;i<N;i++) w1[i]=complex(cos(pi*2*i/N),sin(pi*2*i/N));
for(int i=0;i<N;i++) w2[i]=w1[i].conj();
}
void fft(complex *r,complex *w,int f) {
for(int i=0;i<N;i++) if(pos[i]>i) swap(r[i],r[pos[i]]);
for(int i=1;i<N;i<<=1)
for(int j=0;j<N;j+=(i<<1))
for(int k=0;k<i;k++) {
complex x=r[j+k],y=w[N/(i<<1)*k]*r[i+j+k];
r[j+k]=x+y,r[i+j+k]=x-y;
}
if(f==-1) for(int i=0;i<N;i++) r[i].r/=N,r[i].i=0;
}
void mul(int *A,int *B,int *C) {
for(int i=0;i<=n;i++) a[i]=A[i]/p,b[i]=A[i]%p;
for(int i=0;i<=m;i++) c[i]=B[i]/p,d[i]=B[i]%p;
init();
fft(a,w1,1),fft(b,w1,1),fft(c,w1,1),fft(d,w1,1);
for(int i=0;i<N;i++) {
complex tmpa=a[i],tmpb=b[i],tmpc=c[i],tmpd=d[i];
a[i]=tmpa*tmpc,b[i]=tmpa*tmpd+tmpb*tmpc,c[i]=tmpb*tmpd;
}
fft(a,w2,-1),fft(b,w2,-1),fft(c,w2,-1);
for(int i=0;i<N;i++) {
ll tmpa=ll(a[i].r+0.5),tmpb=ll(b[i].r+0.5),tmpc=ll(c[i].r+0.5);
C[i]=(tmpa%mod*p%mod*p%mod+tmpb%mod*p%mod-mod+tmpc)%mod;
}
}
int main() {
read(n),read(m),read(mod);p=sqrt(mod)+1;
for(int i=0;i<=n;i++) read(s[i]),s[i]%=mod;
for(int i=0;i<=m;i++) read(t[i]),t[i]%=mod;
mul(s,t,ans);
for(int i=0;i<=n+m;i++) printf("%d ",(ans[i]+mod)%mod);puts("");
return 0;
}
浅谈FFT&NTT的更多相关文章
- 浅谈FFT、NTT和MTT
前言 \(\text{FFT}\)(快速傅里叶变换)是 \(O(n\log n)\) 解决多项式乘法的一个算法,\(\text{NTT}\)(快速数论变换)则是在模域下的,而 \(\text{MTT} ...
- 浅谈FFT(快速傅里叶变换)
前言 啊摸鱼真爽哈哈哈哈哈哈 这个假期努力多更几篇( 理解本算法需对一些< 常 用 >数学概念比较清楚,如复数.虚数.三角函数等(不会的自己查去(其实就是懒得写了(¬︿̫̿¬☆) 整理了一 ...
- 浅谈FFT(快速傅里叶变换)
本文主要简单写写自己在算法竞赛中学习FFT的经历以及一些自己的理解和想法. FFT的介绍以及入门就不赘述了,网上有许多相关的资料,入门的话推荐这篇博客:FFT(最详细最通俗的入门手册),里面介绍得很详 ...
- 浅谈FFT(快速博立叶变换)&学习笔记
0XFF---FFT是啥? FFT是一种DFT的高效算法,称为快速傅立叶变换(fast Fourier transform),它根据离散傅氏变换的奇.偶.虚.实等 特性,对离散傅立叶变换的算法进行改进 ...
- 浅谈范德蒙德(Vandermonde)方阵的逆矩阵的求法以及快速傅里叶变换(FFT)中IDFT的原理
浅谈范德蒙德(Vandermonde)方阵的逆矩阵与拉格朗日(Lagrange)插值的关系以及快速傅里叶变换(FFT)中IDFT的原理 标签: 行列式 矩阵 线性代数 FFT 拉格朗日插值 只要稍微看 ...
- FFT/NTT复习笔记&多项式&生成函数学习笔记Ⅰ
众所周知,tzc 在 2019 年(12 月 31 日)就第一次开始接触多项式相关算法,可到 2021 年(1 月 1 日)才开始写这篇 blog. 感觉自己开了个大坑( 多项式 多项式乘法 好吧这个 ...
- 浅谈 Fragment 生命周期
版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰 源码:AndroidDemo/Fragment 文中如有纰漏,欢迎大家留言指出. Fragment 是在 Android 3.0 中 ...
- 浅谈 LayoutInflater
浅谈 LayoutInflater 版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰 源码:AndroidDemo/View 文中如有纰漏,欢迎大家留言指出. 在 Android 的 ...
- 浅谈Java的throw与throws
转载:http://blog.csdn.net/luoweifu/article/details/10721543 我进行了一些加工,不是本人原创但比原博主要更完善~ 浅谈Java异常 以前虽然知道一 ...
随机推荐
- Drupal8 Console 命令行工具
转载:https://yplam.com/post/79 Drupal Console 是面向Drupal 8 的一套命令行工具,用来生成Drupal 8模板代码,并且可以跟Drupal 8应用进行交 ...
- angular 缓存模板 ng-template $templateCache
由于浏览器加载html模板是异步加载的,如果加载大量的模板会拖慢网站的速度,这里有一个技巧,就是先缓存模板. 使用angular缓存模板主要有三种方法: 方法一:通过script标签引入 <sc ...
- JUC——原子类操作(三)
原子类操作 既然强调了并发访问,那么就必须考虑操作系统位数:32位操作系统还是64位操作系统,对于long型数据类型而言,是64位的.但是如果现在项目运行在32位系统上,则long型数据会占用32位空 ...
- [转]50 Tips for Working with Unity (Best Practices)
About these tips These tips are not all applicable to every project. They are based on my experience ...
- Hbase 教程-安装
HBase安装 安装前设置 安装Hadoop在Linux环境下之前,需要建立和使用Linux SSH(安全Shell).按照下面设立Linux环境提供的步骤. 创建一个用户 首先,建议从Unix创建一 ...
- asp.net的forms身份验证 单用户身份验证
asp.net的forms身份验证 单用户身份验证 首先要配置Web.config文件 <system.web> <authentication mode="Forms& ...
- 学习使用Git 版本控制 代码管理
title: 学习使用Git 版本控制 代码管理 notebook: 经验累积 tags:Git --- Git 版本控制 学习教程 Git版本控制器,可以作为程序员.计算机科学和软件工程的研究人员在 ...
- 算法笔记(c++)--完全背包问题
算法笔记(c++)--完全背包和多重背包问题 完全背包 完全背包不同于01背包-完全背包里面的东西数量无限 假设现在有5种物品重量为5,4,3,2,1 价值为1,2,3,4,5 背包容量为10 # ...
- eclipse 简单操作
1.设置字体: windows --> preferences --> general --> Colors and Fonts --> Basic --> 双击 Tex ...
- Python 装饰器Decorator(一)
(一) 装饰器基础知识 什么是Python装饰器?Python里装饰器是一个可调用的对象(函数),其参数是另一个函数(被装饰的函数) 假如有一个名字为somedecorator的装饰器,target是 ...