只是学习笔记，真心推荐 cmd ，他讲的真的细到把所有的前置知识都讲了一遍。

\[FBI \ WARNING：本篇 NTT 部分非常不完善
\]

FFT & NTT & FWT 大杂烩

首先我们引入卷积的概念，对于两个多项式进行卷积，形如：

\[F(x) = f(x) \oplus g(x)
\]

有

\[F_n = \sum_{i \oplus j = n} f_i g_j
\]

其中 $ F_n , f_i , g_j $ 均表示多项式 $ F , f, g $ 的某一项系数。

一般来说两个多项式进行朴素实现是 $ O(mn) $ ， $ m ,n $ 分别是两个多项式的次数。

那么就下来介绍几种对于特殊的卷积可以加快速度的算法。

一、FFT

FFT 是针对于加法卷积（也就是多项式相乘）的快速计算方法。

大体思路

首先我们知道对于一个 $ n $ 次多项式可以由 $ n+1 $ 个不同的点来表示，而对于两个多项式 $ f(x) , g(x) $ 相乘，我们可以通过 $ n+1 $ 个点在 $ O(n) $ 时间复杂度内完成，然后在通过插值将得到的 $ n+1 $ 个点还原成一个多项式。这就是 FFT 的大体思路。

但是朴素求值和插值都是 $ O(n^2) $ 的，所以我们现在要优化求值和插值的过程。

加速

前置：单位根

首先大家应该学过复数，接下来介绍单位根 。

有一个单位圆，我们通过 $ n $ 条线将它均分成了 $ n $ 份，我们依次编号 $ 0,1,2,\cdots ,n-1 $ ，他们对应的复数就是单位根 $ w_n^{i} $

如图是 $ n = 4 $ 的情况，他恰好对应着坐标轴。

有一天FFT的发明者傅里叶突然想把 $ w_n^i $ 代入到多项式中，然后发现这玩意有很好的性质以至于可以快速求值和插值。

首先由几个性质在几何角度看来非常容易证明：

1、 $ w_n^0 = 1 $

2、 $ w_n^k = w_n^{ k \mod n } $

3、 $ (w_n^k) ^j = w_n^{jk} $

4、 $ w_n^k \times w_n^j = w_n^{k+j} $

5、 $ w_{2n}^{2k} = w_n^k $

6、 $ n $ 是偶数， $ w_n^{k + \frac{n}{2}} = - w_n^k $

主体

那么接下来讲解 FFT 的主要过程：

求值：

对一个长度为 $ n $ 的序列，它对应着一个 $ n-1 $ 次多项式 $ F(x) $ 。

对于 $ F(x) $ ，我们按奇偶把他一分为二，下标为偶数的在前面，称为 $ Fl(x) $ ，下标为奇数的在后面，称为 $ Fr(x) $ 。

那么我们尝试写出 $ F(x) $ 与 $ Fl(x) , Fr(x) $ 的关系式：

\[F(x) = Fl(x^2) + x Fr(x^2)
\]

接下来就是单位根出场的时候了，我们将 $ w_n^k $ 代入 $ F(x) $ 和上述式子：

对于 $ k \lt \frac{n}{2} $ 有

\[\begin{aligned}
F( w_n^k ) &= Fl( w_n^{2k} ) + w_n^k Fr( w_n^{2k} ) \\
&= Fl(w_{\frac{n}{2}}^k) + w_n^k Fr( w_{\frac{n}{2}}^k )
\end{aligned}
\]

对于 $ k \lt \frac{n}{2} $ ，我们代入 $ w_n^{k + \frac{n}{2}} $ 有

\[\begin{aligned}
F(w_n^{k+\frac{n}{2}}) &= Fl(w_n^{2k+n}) + w_n^{k+\frac{n}{2}} Fr(w_n^{2k+n}) \\
&= Fl(w_{\frac{n}{2}}^k) - w_n^k Fr(w_{\frac{n}{2}}^k)
\end{aligned}
\]

上面的式子意味着什么，它意味着我们可以通过分治去 $ O(n \log n) $ 计算 $ F(w_n^k) $ 的值。

好，我们现在已经可以 $ O(n \log n) $ 的将一个多项式转化为 $ ( w_n^k , F( w_n^k ) ) $ 的点值表达式了，然后可以 $ O(n) $ 点乘出最终的多项式，然后我们现在需要快速将这个多项式插回去。

插值：

设我们刚才把 $ F(x) $ 转成了 $ G(x) $ 。那么我们直接不加证明的给出：

\[n F(k) = \sum_{i=0}^{n-1} (w_n^{-k})^i G(i)
\]

算了还是证明一下：

我们将 $ G(i) $ 代入

\[\begin{aligned}
右边 &= \sum_{i=0}^{n-1} w_n^{-ik} \sum_{j=0}^{n-1} w_n^{ij} F(j) \\
&= \sum_{j=0}^{n-1} F(j) w_n^{ij} \sum_{i=0}^{n-1} w_n^{-ik} \\
&= \sum_{j=0}^{n-1} F(j) \sum_{i=0}^{n-1} w_n^{i(j-k)}
\end{aligned}
\]

分类讨论，对于 $ j=k $ 的情况：

贡献为 $ F(k) \sum_{i=0}^{n-1} w_n^0 = n F(k) $

对于 $ j \not = k $ 的情况：

贡献为 $ F(j) \sum_{i=0}^{n-1} w_n^{i p} $ ，等比数列求和， $ \sum_{i=0}^{n-1} w_n^{i p} = \frac{ w_n^{ n p } - 1 }{ w_n^p - 1 } = 0 $ ，也就是没有贡献！

所以最终就有

\[右边 = n F(k) = 左边
\]

所以我们将插值也转成了求值，同样可以 $ O(n \log n) $ 求。

实现

朴素实现

现在可以再来看一开始的流程图

整个过程就比较清晰了吧。

给出模板题： P3803 【模板】多项式乘法（FFT）

码(未卡常版本)

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

typedef pair<int,int> pii;

typedef unsigned long long ull;

#define mk make_pair

#define ps push_back

#define fi first

#define se second

const int N=5e6+10,inf=0x3f3f3f3f;

const ll mod=1e9+7,linf=0x3f3f3f3f3f3f3f3f;

inline ll read(){

	char c=getchar();ll x=0;bool f=0;

	while(!isdigit(c))f=c=='-'?1:0,c=getchar();

	while(isdigit(c))x=(x<<1)+(x<<3)+(c^48),c=getchar();

	return f?-x:x;

}

const double PI=acos(-1);

int n,m;

struct jj{

    // 复数结构体

	double x,y;

	inline jj operator +(const jj&k){return {x+k.x,y+k.y};}

	inline jj operator -(const jj&k){return {x-k.x,y-k.y};}

	inline jj operator *(const jj&k){return {x*k.x-y*k.y,x*k.y+y*k.x};}

	inline jj operator /(const jj&k){return {(x*k.x-y*k.y)/(k.x*k.x+k.y*k.y),(y*k.x+x*k.y)/(k.x*k.x+k.y*k.y)};}

}f[N],g[N],tp[N];

inline void fft(jj *f,int l,int r,bool fl){

	if(l==r)return;

	int mid=l+r>>1,len=r-l+1;

	for(int i=l;i<=r;++i)

		tp[i]=f[i];

	for(int i=l;i<=mid;++i){

		f[i]=tp[(i-l)*2+l],f[mid+1+(i-l)]=tp[(i-l)*2+l+1];// 按照奇偶分裂

	}

	fft(f,l,mid,fl),fft(f,mid+1,r,fl);// 分治计算

	jj op={cos(2*PI/len),sin(2*PI/len)},now={1,0};// op=w_n^1

	if(fl)op.y*=-1;// 如果 fl 为 1 表示是插值，此时 op=w_n^-1

	for(int i=l;i<=mid;++i){

		tp[i]=f[i]+now*f[mid+1+(i-l)];

		tp[mid+1+(i-l)]=f[i]-now*f[mid+1+(i-l)];

		now=now*op;

	}

	for(int i=l;i<=r;++i)

		f[i]=tp[i];

}

signed main(){

	#ifndef ONLINE_JUDGE

	freopen("in.in","r",stdin);

	freopen("out.out","w",stdout);

	#endif

	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);

	n=read(),m=read();

	for(int i=0;i<=n;++i)

		f[i]={read(),0};

	for(int i=0;i<=m;++i)

		g[i]={read(),0};

	m+=n;n=1;

	while(n<=m)n<<=1;

	--n;

	fft(f,0,n,0),fft(g,0,n,0);

	for(int i=0;i<=n;++i)

		f[i]=f[i]*g[i];

	fft(f,0,n,1);

	for(int i=0;i<=m;++i){

		cout<<(int)(f[i].x/(n+1)+0.499)<<' ';//有精度问题，四舍五入

	}

}

常数非常大，luogu最大点跑了 800 ms ，考虑一些优化。

优化

首先可以把递归改为非递归版的迭代。其次一个重要优化是 蝴蝶变换 。他说的是我们递归的过程会把 $ F(x) $ 按奇偶分裂，我们最终分裂好的整个序列原来在 $ i $ （下标从 0 开始）位置的数，现在在 $ i $ 按照二进制翻转后的数为下标的地方，比如说 $ 1010111_2 (87_{10}) $ ，在翻转后是 $ 1110101_2 (117_{10}) $ 。

首先证明这个事：

我们脑动模拟一下递归过程，每次按照偶在左半边，奇在右半边去分，相当于看二进制下最后一位，按照大小确定了最终二进制下第一位的大小。

有点抽象，但是有图：

以下将经过 $ i $ 次分裂的序列称为 $ F_i $

这是一开始的 $ F_0(x) $

然后我们按照最后一位的大小，分开

这时可以看到 $ F_1 $ 的下标的最后一位和 $ F_0 $ 下标的第一位相同，因为一开始我们是按第一位大小排的，后来我们按最后一位大小排的。同时前一半和后一半没有关系了，他们各自内部都是按大小排好的，而且此时所有数的最后一位是啥不重要了，相当于所有数最后一位没了，倒数第二位顺延为最后一位，继续递归处理。

那么下一层也就根据 $ F_1 $ 的最后一位，也就是倒数第二位确定了第二位的是啥，然后 $ \cdots $ ，也就相当于二进制翻转。

而事实也确实如此。

好，设 $ pos_i $ 表示 $ i $ 翻转后的答案，那么我们怎么求 $ pos_i $ ? 可以考虑先翻转最后一位之前的，由 $ pos_{i/2} $ 得到，同时翻转最后最后一位，于是有 pos[i]=(pos[i>>1]>>1)|(i&1?n>>1:0) ， $ n $ 是序列长度。

所以我们就获得了一个常数较小的 FFT：

码(卡常版)

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

typedef pair<int,int> pii;

typedef unsigned long long ull;

#define mk make_pair

#define ps push_back

#define fi first

#define se second

const int N=1e6+10,inf=0x3f3f3f3f;

const ll mod=1e9+7,linf=0x3f3f3f3f3f3f3f3f;

inline ll read(){

	char c=getchar();ll x=0;bool f=0;

	while(!isdigit(c))f=c=='-'?1:0,c=getchar();

	while(isdigit(c))x=(x<<1)+(x<<3)+(c^48),c=getchar();

	return f?-x:x;

}

const double PI=acos(-1);

struct jj{

	double x,y;

	inline jj operator +(const jj&k){return {x+k.x,y+k.y};}

	inline jj operator -(const jj&k){return {x-k.x,y-k.y};}

	inline jj operator *(const jj&k){return {x*k.x-y*k.y,x*k.y+y*k.x};}

}f[N<<2],g[N<<2],ji[N<<2];

int pos[N<<2];

inline void fft(jj *f,int n,bool fl){

	for(int i=0;i<n;++i)

		if(i<pos[i])swap(f[i],f[pos[i]]);//pos[i] 表示预处理二进制翻转后的位置

	for(int len=2,mid;len<=n;len<<=1){

		mid=len>>1;

		jj op=ji[len],lp;//ji[len]表示预处理 w_n^1 ，因为 sin,cos 太慢了，所以预处理会少调用几次

		if(fl)op.y*=-1;

		for(int i=0;i<n;i+=len){

			jj now={1,0};

			for(int j=i;j<i+mid;++j){

				lp=now*f[j+mid];

				f[j+mid]=f[j]-lp;f[j]=f[j]+lp;

				now=now*op;

			}

		}

	}

}

int n,m;

signed main(){

	#ifndef ONLINE_JUDGE

	freopen("in.in","r",stdin);

	freopen("out.out","w",stdout);

	#endif

	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);

	n=read(),m=read();

	for(int i=0;i<=n;++i)

		f[i]={read(),0};

	for(int i=0;i<=m;++i)

		g[i]={read(),0};

	m+=n;n=1;ji[1]={1,0};

	while(n<=m)n<<=1,ji[n]={cos(2*PI/n),sin(2*PI/n)};

	for(int i=0;i<n;++i)

		pos[i]=(pos[i>>1]>>1)|(i&1?n>>1:0);

	fft(f,n,0),fft(g,n,0);

	for(int i=0;i<=n;++i)

		f[i]=f[i]*g[i];

	fft(f,n,1);

	for(int i=0;i<=m;++i){

		cout<<(int)(f[i].x/n+0.499)<<' ';

	}

}

luogu最大点 469 ms ，而且出奇的好写。

例题

P1919 【模板】高精度乘法 | A*B Problem 升级版

另一个板子题，FFT 加速即可。

P3338 [ZJOI2014] 力

给出序列 $ q $ ，有

\[E_i = \sum_{i=1}^{j-1} \frac{q_i}{(i-j)^2} - \sum_{i=j+1}^{n} \frac{q_i}{(i-j)^2}
\]

求所有的 $ E_i $

我们考虑如何把 $ E_i $ 转成卷积的形式。首先把烦人的除法去掉，令 $ G(x) = \frac{1}{x^2} $ ，特殊的， $ G(0) = 0 $ ，同时令 $ q_0 = 0 $ ，那么有

\[E_i = \sum_{i=0}^{j} q(i) G(j-i) - \sum_{i=j}^{n} q(i) G(i-j)
\]

前面已经是卷积的形式了，无需转化，后面的不是，我们考虑给他转成卷积的形式。

画个图看看：

他们是这样相乘的，但是卷积是这样相乘的：

所以我们考虑给 $ q(x) $ 转过来，变成 $ Q(x) $ ，所以后面的式子就变成了

\[\sum_{i=0}^{k=n-j} Q(i) G(k-i)
\]

对两者 FFT 然后加起来即可。

二、 NTT

NTT ，中文 快速数论变换 是用来解决卷积过程中需要取模的快速加法卷积，说白了就是可以取模的 FFT。

这个东西就是直接把 $ w_n^1 $ 替换成了 $ g^{ \lfloor \frac{mod-1}{n} \rfloor } $ ，其中 $ mod $ 是模数，$ g $ 是模数的一个原根，$ n $ 是序列长度，但是原根这个东西我也不会，目前只知道 998244353 的原根是 3 ，所以 NTT 到此为止。

码

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

#define int ll

typedef pair<int,int> pii;

typedef unsigned long long ull;

#define mk make_pair

#define ps push_back

#define fi first

#define se second

const int N=1e6+10,inf=0x3f3f3f3f;

const ll mod=998244353,linf=0x3f3f3f3f3f3f3f3f,g=3;

inline ll read(){

	char c=getchar();ll x=0;bool f=0;

	while(!isdigit(c))f=c=='-'?1:0,c=getchar();

	while(isdigit(c))x=(x<<1)+(x<<3)+(c^48),c=getchar();

	return f?-x:x;

}

inline ll qpow(ll x,ll y){

	ll ans=1;

	while(y){

		if(y&1)ans=ans*x%mod;

		x=x*x%mod;y>>=1;

	}

	return ans;

}

ll ng=qpow(g,mod-2);// g 的逆元

int pos[N<<2];

inline void ntt(ll *f,int n,bool fl){

	for(int i=0;i<n;++i)

		if(i<pos[i])swap(f[i],f[pos[i]]);

	for(int len=2,mid;len<=n;len<<=1){

		int op=qpow(fl?g:ng,(mod-1)/len),tp;mid=len>>1;

		for(int i=0;i<n;i+=len){

			ll now=1;

			for(int j=i;j<i+mid;++j){

				tp=f[j+mid]*now%mod;

				f[j+mid]=f[j]-tp;

				if(f[j+mid]<0)f[j+mid]+=mod;

				f[j]+=tp;

				if(f[j]>=mod)f[j]-=mod;

				now=now*op%mod;

			}

		}

	}

}

int n,m;

ll f[N<<2],ff[N<<2];

signed main(){

	#ifndef ONLINE_JUDGE

	freopen("in.in","r",stdin);

	freopen("out.out","w",stdout);

	#endif

	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);

	n=read(),m=read();

	for(int i=0;i<=n;++i)

		f[i]=read();

	for(int i=0;i<=m;++i)

		ff[i]=read();

	m+=n;n=1;

	while(n<=m)n<<=1;

	for(int i=0;i<n;++i)

		pos[i]=(pos[i>>1]>>1)|(i&1?n>>1:0);

	ntt(f,n,0),ntt(ff,n,0);

	for(int i=0;i<n;++i)

		f[i]=f[i]*ff[i]%mod;

	ntt(f,n,1);

	ll ny=qpow(n,mod-2);

	for(int i=0;i<=m;++i)

		cout<<f[i]*ny%mod<<' ';

}

但是我的 NTT 好像没有 FFT 快？？？

三、 FWT

在 OI 中，FWT是用来解决有关位运算卷积的快速卷积算法。

即对于 $ c_i = \sum_{i = j \oplus k } a_j b_k $ ，在知道 $ a,b $ 的情况下，快速计算 $ c $ 。

或运算

此时 $ \oplus \to | $ 。

我们设 $ A,B,C $ 分别对应 $ a,b,c $ 进行了 FWT 后的序列，我们定义 $ A_i = \sum_{i=i|j} a_j $ ，那么自然有 $ C_i = A_i \cdot B_i $ 。

考虑如何快速求 $ A $ ，我们考虑初始序列 $ a $ ，它的长度 $ n $ 是 2 的整数次幂，我们将 $ a $ 一分为二，左边为 $ a_0 $ ，右边为 $ a_1 $ ，两者没有任何关系，直接递归求出 $ A_0 , A_1 $ ，此时需要需要合并 $ A_0,A_1 $ 为 $ A $ ，即，把 $ a_0 $ 向 $ A_1 $ 的贡献考虑进来， $ a_1 $ 向 $ A_0 $ 中的贡献考虑进来。

注意到将 $ a_1 $ 向 $ A_0 $ 考虑时，其中 $ a_1 $ 的目前最高位上一定是 1 ，而 $ a_0 $ 中的数一定是 0 ，所以 $ a_1 $ 不可能向 $ A_0 $ 做贡献。

再看 $ a_0 $ 向 $ A_1 $ 做贡献，注意到 $ \large a_{0_j} | a_{1_i} = a_{1_i} $ 当且仅当 $ \large a_{0_j} | a_{0_i} = a_{0_i} $ ，即能向 $ a_{0_i} $ 做贡献的都能向 $ a_{1_i} $ 做贡献，所以有

\[A = he( A_0 , A_0 + A_1 )
\]

其中 $ + $ 表示多项式相加， $ he(x,y) $ 表示将 $ x,y $ 两个序列顺序连接。所以我们可以分治去求 $ A $ 。

类似的可以退出逆运算为

\[A = he( A_0 , A_0 - A_1 )
\]

也就可以在得到 $ C $ 之后反推出 $ c $ 。

注

感觉就和 FFT ， NTT 一样， FWT(|) 找了一种特殊运算，使得可以分治 $ O(n \log n) $ 的去求值和插值。同时分治的过程可以看成逐渐考虑二进制上每一位的影响。

与运算

类比或运算，这里直接给出式子

求值：

\[A = he( A_0 + A_1 , A_1 )
\]

插值：

\[A = he( A_0 - A_1 , A_1 )
\]

异或运算

异或运算是 FWT 中最难理解的一个，是一种非常神奇的构造。

以下 $ \oplus \to xor $

首先我们定义 $ x \circ y = popcount( x \oplus y ) \mod 2 $ ，然后我们先给出 $ ( x \circ y ) \oplus ( x \circ z ) = x \circ ( y \oplus z ) $ 。

证明：

我们一位一位的去考虑，在一开始，两边都是 0，然后考虑新的一位，如果要做出改变，首先 $ x $ 在这位上得是 1，否则不用考虑。然后看 $ y \oplus z $ 的值，如果为 1 ，说明两个数一个是 1，一个是 0，所以此时左边右边的值都会改变，不影响等式成立。如果 $ y \oplus z = 0 $ ，说明两者一样，此时两边的值都不会改变，也不影响等式成立。

综上， $ ( x \circ y ) \oplus ( x \circ z ) = x \circ ( y \oplus z ) $ 。

接下来我们定义 $ A_i = \sum_{i \circ j = 0} a_j - \sum_{i \circ j = 1} a_j $ ，那么有

\[\begin{aligned}
A_i \cdot B_i &= ( \sum_{i \circ j = 0} a_j - \sum_{i \circ j = 1} a_j ) \cdot ( \sum_{i \circ j = 0} b_j - \sum_{i \circ j = 1} b_j ) \\
&= (\sum_{i \circ j = 0} a_j \sum_{i \circ k =0} b_k + \sum_{i \circ j = 1} a_j \sum_{i \circ k =1} b_k) - ( \sum_{i \circ j = 0} a_j \sum_{i \circ k =1} b_k + \sum_{i \circ j = 1} a_j \sum_{i \circ k =0} b_k ) \\
&= \sum_{ i \circ (j \oplus k) =0 } a_j b_k - \sum_{ i \circ (j \oplus k) =1 } a_j b_k \\
&= C_i
\end{aligned}
\]

接下来考虑如何快速计算 $ A $ ，我们仍然尝试将它分为 $ A_0,A_1 $ 递归求解，接下来考虑合并。

首先举一个例子：

假设 $ A $ 长度为 8，我们写成二进制形式

然后我们一分为二，递归求解，但是注意递归到下一层后，他们在本层的第一位将不再考虑，也就是

这也就是为什么之前注里面说分治的过程是逐渐考虑二进制位的影响。

理解了这里，下面就很好理解了。

对于 $ A $ ，分为 $ A_0 ,A_1 $ 之后，我们新考虑一位，定义 $ x' $ 为考虑新一位的 $ x $ ，那么有 $ a_{0_i} ' \circ a_{1_j} ' = a_{1_i} \circ a_{1_j} , a_{0_i} ' \circ a_{0_j} ' = a_{0_i} \circ a_{0_j} , a_{1_i} ' \circ a_{1_j} ' = (a_{1_i} \circ a_{1_j}) \oplus 1 , a_{1_i} ' \circ a_{0_j} ' = a_{0_i} \circ a_{0_j} $ ，于是我们有

\[A = he( A_0 + A_1 , A_0 - A_1 )
\]

同时有逆推

\[A = he( \frac{ A_0 + A_1 }{2} , \frac{ A_0 - A_1 }{2} )
\]

模板题

P4717 【模板】快速莫比乌斯/沃尔什变换 (FMT/FWT)

码

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

#define int ll

typedef pair<int,int> pii;

typedef unsigned long long ull;

#define mk make_pair

#define ps push_back

#define fi first

#define se second

const int N=1e6+10,inf=0x3f3f3f3f;

const ll linf=0x3f3f3f3f3f3f3f3f,mod=998244353;

inline ll read(){

	char c=getchar();ll x=0;bool f=0;

	while(!isdigit(c))f=c=='-'?1:0,c=getchar();

	while(isdigit(c))x=(x<<1)+(x<<3)+(c^48),c=getchar();

	return f?-x:x;

}

inline void OR(int *f,int n,int op){

	for(int len=2;len<=n;len<<=1){

		int mid=len>>1;

		for(int j=0;j<n;j+=len){

			for(int k=j;k<j+mid;++k){

				f[k+mid]=(f[k+mid]+f[k]*op)%mod;

			}

		}

	}

}

inline void AND(int *f,int n,int op){

	for(int len=2;len<=n;len<<=1){

		int mid=len>>1;

		for(int j=0;j<n;j+=len){

			for(int k=j;k<j+mid;++k)

				f[k]=(f[k]+f[k+mid]*op)%mod;

		}

	}

}

inline void XOR(int *f,int n,int op){

	for(int len=2;len<=n;len<<=1){

		int mid=len>>1,tp;

		for(int j=0;j<n;j+=len){

			for(int k=j;k<j+mid;++k){

				tp=f[k];

				f[k]=(f[k]+f[k+mid])*op%mod;

				f[k+mid]=(tp-f[k+mid])*op%mod;

			}

		}

	}

}

inline ll qpow(ll x,ll y){

	ll ans=1;

	while(y){

		if(y&1)ans=ans*x%mod;

		x=x*x%mod;y>>=1;

	}

	return ans;

}

int a[N],b[N],c[N],n;

signed main(){

	#ifndef ONLINE_JUDGE

	freopen("in.in","r",stdin);

	freopen("out.out","w",stdout);

	#endif

	ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);

	n=read();int m=1<<n;

	for(int i=0;i<m;++i)

		a[i]=read();

	for(int i=0;i<m;++i)

		b[i]=read();

	OR(a,m,1),OR(b,m,1);

	for(int i=0;i<m;++i)

		c[i]=a[i]*b[i]%mod;

	OR(c,m,-1);OR(a,m,-1),OR(b,m,-1);

	for(int i=0;i<m;++i)

		cout<<(c[i]+mod)%mod<<' ';

	cout<<'\n';

	AND(a,m,1);AND(b,m,1);

	for(int i=0;i<m;++i)

		c[i]=a[i]*b[i]%mod;

	AND(a,m,-1),AND(b,m,-1),AND(c,m,-1);

	for(int i=0;i<m;++i)

		cout<<(c[i]+mod)%mod<<' ';

	cout<<'\n';

	XOR(a,m,1),XOR(b,m,1);

	for(int i=0;i<m;++i)

		c[i]=a[i]*b[i]%mod;

	XOR(c,m,qpow(2,mod-2));

	for(int i=0;i<m;++i)

		cout<<(c[i]+mod)%mod<<' ';

}

小结

感觉三者都是通过构造找了一些特殊的点或特殊的运算，使得我们可以通过这写特殊的性质达到快速计算的效果，当然这一切的前提都是因为我们用到的 $ O(n) $ 点乘对点是没有要求的，这就支撑着我们可以通过构造特殊点来完成快速卷积。

FFT & NTT & FWT的更多相关文章

[学习笔记&教程] 信号, 集合, 多项式, 以及各种卷积性变换 (FFT,NTT,FWT,FMT)
目录信号, 集合, 多项式, 以及卷积性变换卷积卷积性变换傅里叶变换与信号引入: 信号分析变换的基础: 复数傅里叶变换离散傅里叶变换 FFT 与多项式 $n$ 次单位复根消去引理 ...
$FFT/NTT/FWT$题单&简要题解
打算写一个多项式总结. 虽然自己菜得太真实了. 好像四级标题太小了,下次写博客的时候再考虑一下. 模板 $FFT$模板 #include <iostream> #include < ...
FFT \ NTT总结(多项式的构造方法)
前言.FFT NTT 算法网上有很多,这里不再赘述. 模板见我的代码库: FFT:戳我 NTT:戳我正经向:FFT题目解题思路 $FFT$这个玩意不可能直接裸考的..... 其实一般\(FF ...
FFT/NTT/MTT学习笔记
FFT/NTT/MTT Tags:数学作业部落评论地址前言这是网上的优秀博客并不建议初学者看我的博客,因为我也不是很了解FFT的具体原理一.概述两个多项式相乘,不用$N^2$,通过\ ...
FFT&NTT总结
FFT&NTT总结一些概念 $DFT:$离散傅里叶变换$\rightarrow O(n^2)$计算多项式卷积 $FFT:$快速傅里叶变换\(\rightarrow O(nlogn ...
快速构造FFT/NTT
@(学习笔记)[FFT, NTT] 问题概述给出两个次数为$n$的多项式$A$和$B$, 要求在$O(n \log n)$内求出它们的卷积, 即对于结果$C$的每一项, 都有\[ ...
FFT/NTT模板既 HDU1402 A * B Problem Plus
@(学习笔记)[FFT, NTT] Problem Description Calculate A * B. Input Each line will contain two integers A a ...
FFT/NTT基础题总结
在学各种数各种反演之前把以前做的$FFT$/$NTT$的题整理一遍还请数论$dalao$口下留情 T1快速傅立叶之二题目中要求求出 $c_k=\sum\limits_{i=k}^{n-1}a_i* ...
FFT&NTT数学解释
FFT和NTT真是噩梦呢既然被FFT和NTT坑够了,坑一下其他的人也未尝不可呢前置知识多项式基础知识矩阵基础知识(之后会一直用矩阵表达) FFT:复数基础知识 NTT:模运算基础知识单位根介 ...
HDU-4609(FFT/NTT)
HDU-4609(FFT/NTT) 题意: 给出n个木棒,现从中不重复地选出3根来,求能拼出三角形的概率. 计算合法概率容易出现重复,所以建议计算不合法方案数枚举选出的最大边是哪条,然后考虑剩下两条 ...

随机推荐

分布式对象存储之FDFS
1.它是一个开源的分布式文件系统,它对文件进行管理. 功能有:文件存储.文件同步.文件访问(文件的上传下载)等.特别适合以文件为主的在线服务. 2.fastDFS服务端有两个角色:跟踪器(tracke ...
brew之加速
有没有出现这种场景:使用brew install 安装程序,一直卡在brew updating,这可能是使用着默认的github镜像源导致,那么我们就需要将其切换到国内 1.镜像切换(推荐中科大) 1 ...
mindoc 迁移
1.备份数据库 mysqldump --databases mindoc_db > mindoc_db.sqlmysqldump -u USER_NAME -p PASSWORD [其他选项] ...
CMYK与RGB参数转换公式及转换方法
1. RGB色彩模式自然界中绝大部分的可见光谱可以用红.绿和蓝三色光按不同比例和强度的混合来表示.RGB分别代表着3种颜色:R代表红色,G代表绿色.B代表蓝色.RGB模型也称为加色模型,如图5所示. ...
OS之《内存管理》
程序装入方式绝对装入:程序逻辑地址和物理地址是完全对应的.不现实可重定位装入:装入的时候重新计算内存地址.程序中的实际地址加上程序载入的起始地址:但是解决不了进程挂起后重新唤醒的问题.唤醒的后 ...
git 基础操作 && 在"develop"分支修改动但不想提交切换到"master"分支(最后)
测试学习准备条件:一个目录,含不含有文件都可以,创建一个test.txt 1. 创建空仓库 git init 2. 修改过后,添加到本地仓库添加指定的文件,如果一个以上,文件名空格隔开 git ad ...
iOS - 利用 UIBezierPath 绘制圆弧
iOS - 利用 UIBezierPath 绘制圆弧 API UIBezierPath 绘制圆弧主要利用以下方法: open func addArc(withCenter center: CGPoin ...
Dockerr安装Oracle以及使用DBeaver连接
拉取镜像 pull container-registry.oracle.com/database/free:latest 创建容器说明一下我现在的最新版本是23 docker run -d --na ...
【前端】【H5 API】地理定位（获取经纬度）
H5 API 地理定位地理定位在日常生活中应用比较广泛,例如,互联网打车.在线地图等.在HTML 5的规范中,增加了获取用户地理位置信息的接口Geolocation,开发者可以通过经纬度来获取用户的 ...
Docker 容器运行一个 web 应用
Docker 容器安装和基础使用请看上一篇 Docker 容器运行一个 web 应用使用 docker 构建一个 web 应用程序. docker pull training/webapp # 载入 ...

FFT & NTT & FWT