@(学习笔记)[FFT, NTT]

问题概述

给出两个次数为\(n\)的多项式\(A\)和\(B\), 要求在\(O(n \log n)\)内求出它们的卷积, 即对于结果\(C\)的每一项, 都有$$c_i = \sum_{j = 0}^{n}a_j \cdot b_{i - j}$$

问题求解

大致思路

  • 朴素做法: 考虑按照上面的式子暴力运算, 时间复杂度: \(O(n^2)\)
  • 考虑把多项式化作点值表达, 记$$A(x) =\sum_{i = 0}^n a_i x^i$$ 我们把\(A\)和\(B\)的点值表达乘起来, 得到的就是\(C\)的点值表达, 即$$A(x) \cdot B(x) = C(x)$$
  • 我们把\(x \to A(x)\)的运算称作是DFT(离散傅立叶变换Discrete Fourier Transform)
  • 对于一个次数为\(n\)的多项式, 我们有它的\(n\)组不同点值表达, 通过点值表达求出原多项式的每一项的运算, 我们称之为IDFT(逆傅立叶变换)

DFT

考虑两个次数为\(n\)的多项式卷积, 得到的结果次数最高达到了\(2n - 1\). 所以我们至少需要\(2n - 1\)个结果的点值表达, 才足够把结果逆推出来(Hint: 为什么是\(2n-1\)个点值表达? 大体上可以从拉格朗日插值法来理解.).

考虑如何化简运算.

我们把多项式\(A\)拆分开奇数位和偶数位, 来计算它的点值表达. 我们令\(x_k\)为代入多项式计算的第\(k\)个值, 记$$f_0(x_k) = a_0 x_k^0 + a_2 x_k^1 + a_4 x_k^2 + ... + a_{2m} x_k^m$$

\[f_1(x_k) = a_1 x_k^1 + a_3 x_k^2 + a_5 x_k^3 + ... + a_{2m + 1} x_k^m
\]

则我们发现原多项式可以被表示作$$f(x_k) = f_0(x_k^2) + x_k \cdot f_1(x_k^2)$$

这样, 求原来长度为\(len\)的多项式的点值表达, 就变成求2个长度为\(\frac{len}{2}\)的多项式的点值表达.

我们还注意到, 这里代入\(f_0\)和\(f_1\)计算的值为\(x_k^2\). 假如我们代入的\(x_i\)和\(x_j\)满足\(x_i^2 = x_j^2\)且\(x_i \ne x_j\), 则只需要在\(f_0\)和\(f_1\)中代入一个值进行运算, 再分别把\(f_1\)分别乘上\(x_i\)和\(x_j\), 就可以一次处理出\(f(x_i)\)和\(f(x_j)\)两个的结果. 这种优化手段就是FFT和NTT的基本思想.

考虑如何构造\(x_i^2 = x_j^2\).

这里我们以NTT为例. 在数论意义下, 根据费马小定理, 有$$g^{p - 1} \equiv 1 \mod p: p \in 素数$$.

当我们要代入\(n\)个值计算多项式的点值表达时, 令\(x_0 = 1, x_1 = g^{\frac{p - 1}{n}} ... x_k = g^{\frac{p - 1}{n} \cdot k}\), 则有$$x_{k + \frac{n}{2}}^2 = \left( \left(g^{\frac{p - 1}{n}} \right)^{k + \frac{n}{2}} \right)^2 = \left( g^{\frac{p - 1}{n} \cdot k} \right)^2 \cdot g^{p - 1} \equiv \left( g^{\frac{p - 1}{n} \cdot k} \right)^2 = x_k^2 \mod p$$

则每个\(x_k\)都可以与\(x_{k + \frac{n}{2}}\)分为一组, 一起计算.

这样, 我们就可以在\(O(n \log n)\)内求出所需要的\(n\)个点值表达.

IDFT

我们把得到的点值表达看作是一个多项式, 再按照上面的DFT的做法搞一次, 得到这个点值表达的点值表达(大雾). 把每个点值表达都除以点值的个数, 即得到了\(C\)的每一项.

不会证.

结束.

Code

#include <cstdio>
#include <cctype>
#include <algorithm> const int N = (int)5e4, P = 998244353, G = 3; namespace Zeonfai
{
inline int getInt()
{
int sgn = 1, a = 0;
char c; while(! isdigit(c = getchar()))
if(c == '-')
sgn *= -1; while(isdigit(c))
a = a * 10 + c - '0', c = getchar(); return a * sgn;
}
} namespace convolution
{
const int DEG = N << 2;
int deg, rev[DEG], omega[DEG], inv[DEG]; inline int modPower(int a, int x)
{
int res = 1; for(; x; a = (long long)a * a % P, x >>= 1)
if(x & 1)
res = (long long) res * a % P; return res;
} inline void pretreat(int n, int m)
{
int sum = n + m;
deg = 1;
int bit = 0; for(; deg < sum; deg <<= 1, ++ bit); rev[0] = 0; for(int i = 1; i < deg; ++ i)
rev[i] = rev[i >> 1] >> 1 | (i & 1) << bit - 1; for(int i = 0; 1 << i <= deg; ++ i)
omega[i] = modPower(G, (P - 1) / (1 << i)), inv[i] = modPower(omega[i], P - 2);
} inline void NTT(int *a, int opt)
{
for(int i = 0; i < deg; ++ i)
if(rev[i] < i)
std::swap(a[i], a[rev[i]]); int cnt = 0; for(int i = 2; i <= deg; i <<= 1)
{
++ cnt;
int curOmega = ~ opt ? omega[cnt] : inv[cnt]; for(int j = 0; j < deg; j += i)
{
int omega = 1; for(int k = j; k < j + i / 2; ++ k)
{
int u = a[k], t = (long long)omega * a[k + i / 2] % P;
a[k] = (u + t) % P, a[k + i / 2] = (u - t + P) % P;
omega = (long long)omega * curOmega % P;
}
} } if(opt == -1)
{
int inv = modPower(deg, P - 2); for(int i = 0; i < deg; ++ i)
a[i] = (long long)a[i] * inv % P;
}
} inline void work(int *a, int n, int *b, int m)
{
pretreat(n, m);
NTT(a, 1), NTT(b, 1); for(int i = 0; i < deg; ++ i)
a[i] = (long long)a[i] * b[i] % P; NTT(a, -1); for(int i = 0; i <= n + m; ++ i)
printf("%d ", a[i]);
}
} int main()
{
#ifndef ONLINE_JUDGE
freopen("polynomial.in", "r", stdin);
freopen("polynomial.out", "w", stdout);
#endif using namespace Zeonfai;
int n = getInt(), m = getInt(), tp = getInt();
static int a[N << 2], b[N << 2]; for(int i = 0; i <= n; ++ i)
a[i] = getInt(); for(int i = 0; i <= m; ++ i)
b[i] = getInt(); convolution::work(a, n, b, m);
}

快速构造FFT/NTT的更多相关文章

  1. 快速傅里叶变换FFT / NTT

    目录 FFT 系数表示法 点值表示法 复数 DFT(离散傅里叶变换) 单位根的性质 FFT(快速傅里叶变换) IFFT(快速傅里叶逆变换) NTT 阶 原根 扩展知识 FFT 参考blog: 十分简明 ...

  2. [模板] 快速傅里叶变换/FFT/NTT

    简介 FFT是多项式乘法的一种快速算法, 时间复杂度 \(O(n \log n)\). FFT可以用于求解形如\(C_i = \sum_{j=0}^i A_jB_{i-j}\)的式子. 如果下标有偏差 ...

  3. 多项式 之 快速傅里叶变换(FFT)/数论变换(NTT)/常用套路【入门】

    原文链接https://www.cnblogs.com/zhouzhendong/p/Fast-Fourier-Transform.html 多项式 之 快速傅里叶变换(FFT)/数论变换(NTT)/ ...

  4. Algorithm: 多项式乘法 Polynomial Multiplication: 快速傅里叶变换 FFT / 快速数论变换 NTT

    Intro: 本篇博客将会从朴素乘法讲起,经过分治乘法,到达FFT和NTT 旨在能够让读者(也让自己)充分理解其思想 模板题入口:洛谷 P3803 [模板]多项式乘法(FFT) 朴素乘法 约定:两个多 ...

  5. 再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT)

    再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Bluestein算法+分治FFT+FFT的优化+任意模数NTT) 目录 再探快速傅里叶变换(FFT)学习笔记(其三)(循环卷积的Blueste ...

  6. 快速傅里叶变换FFT& 数论变换NTT

    相关知识 时间域上的函数f(t)经过傅里叶变换(Fourier Transform)变成频率域上的F(w),也就是用一些不同频率正弦曲线的加 权叠加得到时间域上的信号. \[ F(\omega)=\m ...

  7. 快速傅里叶变换(FFT)学习笔记(其二)(NTT)

    再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 目录 再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 写在前面 一些约定 前置知识 同余类和剩余系 欧拉定理 阶 原根 求原根 NTT ...

  8. 模板 - 数学 - 快速傅里叶变换/快速数论变换(FFT/NTT)

    先看看. 通常模数常见的有998244353,1004535809,469762049,这几个的原根都是3.所求的项数还不能超过2的23次方(因为998244353的分解). 感觉没啥用. #incl ...

  9. [学习笔记&教程] 信号, 集合, 多项式, 以及各种卷积性变换 (FFT,NTT,FWT,FMT)

    目录 信号, 集合, 多项式, 以及卷积性变换 卷积 卷积性变换 傅里叶变换与信号 引入: 信号分析 变换的基础: 复数 傅里叶变换 离散傅里叶变换 FFT 与多项式 \(n\) 次单位复根 消去引理 ...

随机推荐

  1. Job for docker.service failed because the control process exited with error code. See "systemctl status docker.service" and "journalctl -xe" for details.

    文档:Docker 启动错误.note链接:http://note.youdao.com/noteshare?id=065111d506e1b132dc930dbe88f5d7b0&sub=A ...

  2. LeetCode(134) Gas Station

    题目 There are N gas stations along a circular route, where the amount of gas at station i is gas[i]. ...

  3. 第十四届华中科技大学程序设计竞赛决赛同步赛 Beautiful Land

    It’s universally acknowledged that there’re innumerable trees in the campus of HUST.Now HUST got a b ...

  4. 当列表推导式遇到lambda(匿名函数)

    Python这么优雅的语言,我也是醉了...... 事情由一段代码引发,请看: 上述的列表推导式+lambda表达式+for循环,他们碰撞出来的结果搞的人晕头转向,咱们逐步来分析一下他们到底是个什么鬼 ...

  5. socket编程了解

    Socket 编程 Socket通讯原理描述: 套接字是为特定网络协议(例如TCP/IP,ICMP/IP,UDP/IP等)套件对上的网络应用程序提供者提供当前可移植标准的对象.它们允许程序接受并进行连 ...

  6. python列出指定目录下的所有目录和文件

    import os import docx def scanfile(rootdir): result = [] for f in os.walk(rootdir): for files in f[2 ...

  7. TransH中的Hinge Loss Function

    Hinge Loss Function Hinge Loss 函数一种目标函数,有时也叫max-margin objective. 在Trans系列中,有一个 \[ \max(0,f(h,r,t) + ...

  8. [转]廖雪峰:datetime用法

    datetime是Python处理日期和时间的标准库. 获取当前日期和时间 我们先看如何获取当前日期和时间: >>> from datetime import datetime &g ...

  9. spring scope 属性的取值

    Spring 容器是通过单例模式创建 Bean 对象的,也就是说,默认情况下,通过调用 ac.getBean("mybean")方法获得的对象都是同一个 mybean 对象 使用单 ...

  10. [luoguP1251] 餐巾计划问题(费用流)

    传送门 模型 网络优化问题,用最小费用最大流解决. 实现 把每天分为二分图两个集合中的顶点Xi,Yi,建立附加源S汇T. 1.从S向每个Xi连一条容量为ri,费用为0的有向边. 2.从每个Yi向T连一 ...