FFT常数优化(共轭优化)
最近闲着无聊研究了下\(FFT\)的常数优化,大概就是各种\(3\)次变\(2or1.5\)次之类的,不过没见过啥题卡这个的吧。
关于\(FFT\)可以看这里:浅谈FFT&NTT。
关于复数
设\(x=a+bi\),其中\(i\)是虚数单位,那么我们用\(\bar x\)表示\(x\)的共轭复数,即\(\bar x=a-bi\)。
共轭复数有一个这样的性质:
\]
证明展开就好了,这个是下面优化的关键。
设\(\omega_n\)为\(n\)阶单位根,则\(\overline{\omega _n^{x}}=\omega_{n}^{-x}\)。
idft变dft
设\(f(x)=\sum_{i=0}^{n-1}a_ix^i\),注意到:
\]
也就是说我们如果进行一次std::reverse(a+1,a+n),然后dft(a),在除以\(n\),我们就完成了一次\(idft\)。
多项式乘法优化 1
给出多项式\(f(x)=\sum_{i=0}^{n}a_ix^i,g(x)=\sum_{i=0}^{m}b_ix^i\),求其卷积。
这里最开始介绍一种非常简洁的优化方法,构造多项式\(h(x)\):
\]
\]
那么我们只需要取\(h^2(x)\)的虚部除以\(2\)就是答案,这只需要做两次\(FFT\)。
多项式乘法优化 2
这个和上面的关联不大,设\(X_i\)表示多项式\(F(x)\)\(dft\)之后的系数,\(a_i\)表示\(dft\)之前的系数,设\(F(x)\)为\(n\)项的多项式,且\(n=2^k\),注意到:
\]
即:\(X_i=\overline{X_{n-i}}\)。
这实质上是因为\(F\)没有虚部的原因,我们换一个有虚部的多项式试试:
X_{n-i}=\sum_{j=0}^{n-1}(a_j+ib_j)\omega_{n}^{-ij}\\
\overline{X_{n-i}}=\sum_{j=0}^{n-1}(a_j-ib_j)\omega_{n}^{ij}\\
\]
等等,我们发现第一个式子和第三个式子很像,两式相加减可以得到:
X_i-\overline{X_{n-i}}=2i\sum_{j=0}^{n-1}b_j\omega_{n}^{ij}
\]
注意到等式右边就是\(a\) \(dft\)完之后的结果,那么对于多项式\(F(x),G(x)\),我们可以构造一个函数然后\(dft\)一次,然后\(O(n)\)得到两个多项式\(dft\)之后的结果,总共只用了一次\(FFT\)。
当然这个玩意也可以这样用:假设我们现在想求\(dft(F(x))\),我们把\(F(x)\)奇偶分类,构造多项式:
\]
然后相当于是\(0.5\)次\(FFT\)来完成这个事,设\(dft(g(x))\)每一项为\(X_i\),\(dft(F(x))\)每一项为\(Y_i\),那么推一下可以得到:
\]
注意这里只有\(i\in [0,n/2)\)的值,\(Y_{n/2}\)特殊处理一下,后面的可以通过前面得到。
MTT常数优化
\(\rm MTT\)就是拆系数\(\rm FFT\),设多项式\(s(x),t(x)\),我们要算\(s(x)t(x)\),模数任意。
我们拆系数,设拆完了之后是\(s(x)=a(x)+b(x)\cdot p,t(x)=c(x)+d(x)\cdot p\)。
构造\(F(x)=a(x)+i\cdot b(x)\),\(G(x)=c(x)+i\cdot d(x)\)。
那么有:
&F(\omega_n^j)=\sum_{i=0}^{n-1}(a_i+ib_i)\omega_n^{ij}\\
&F(\omega_n^{-j})=\sum_{i=0}^{n-1}(a_i+ib_i)\omega_n^{-ij}\\
&\overline{F(\omega_n^{-j})}=\sum_{i=0}^{n-1}(a_i-ib_i)\omega_n^{ij}\\
\end{align}
\]
那么相加减可得\(a(x),b(x)\)的\(dft\)。
令\(h(x)={\rm dft}(a(x))\cdot {\rm dft}(G(x))={\rm dft}(a(x)\cdot G(x))={\rm dft}(a(x)c(x)+i\cdot a(x)d(x))\)。
那么我们\(idft\)一次\(h(x)\)就可以得到\(a(x)c(x),a(x)d(x)\)。
同理可以得到\(b(x)c(x),b(x)d(x)\),一共\(4\)次\(dft\)。
代码长这样:
void mul(int *r,int *s,int *t,int len) {
for(N=1,bit=0;N<len;N<<=1,bit++);
for(int i=1;i<N;i++) pos[i]=pos[i>>1]>>1|((i&1)<<(bit-1));
for(int i=0;i<N;i++) g[0][i]=cp(r[i]&all,r[i]>>15),g[1][i]=cp(s[i]&all,s[i]>>15);
fft(g[0]),fft(g[1]);
for(int i=0;i<N;i++) {
int j=(N-i)&(N-1);
g[2][j]=(g[0][i]+conj(g[0][j]))*cp(0.5,0)*g[1][i];
g[3][j]=(g[0][i]-conj(g[0][j]))*cp(0,-0.5)*g[1][i];
}fft(g[2]),fft(g[3]);
for(int i=0;i<N;i++) g[2][i]=g[2][i]/N,g[3][i]=g[3][i]/N;
for(int i=0;i<N;i++) {
ll pp=g[2][i].r+0.5,x=g[2][i].i+0.5,y=g[3][i].r+0.5,z=g[3][i].i+0.5;
t[i]=(pp%p+(((x+y)%p)<<15)+((z%p)<<30))%p;
}
}
FFT常数优化(共轭优化)的更多相关文章
- spark优化之优化数据结构
概序: 要减少内存的消耗,除了使用高效的序列化类库以外,还有一个很重要的事情,就是优化数据结构.从而避免Java语法特性中所导致的额外内存的开销,比如基于指针的Java数据结构,以及包装类型. 有一个 ...
- c/c++性能优化--- cache优化的一点杂谈
之前写了一篇关于c/c++优化的一点建议,被各种拍砖和吐槽,有赞成的有反对的,还有中立的,网友对那篇博客的的评论和吐槽,我一个都没有删掉,包括一些具有攻击性的言论.笔者有幸阅读过IBM某个项目的框架代 ...
- [原]Android开发优化-Adapter优化
ListView作为Android开发中使用频率最高的一个控件,保证ListView的流畅运行,对用户体验的提高至关重要.Adapter是ListView和数据源之间的中间人,当每条数据进入可见区时, ...
- SqlServer 数据库引擎优化顾问优化数据库
现在一直在做的项目,数据量相对也不小,开始的时候没有觉得,因为是刚开始,数据量还很小,在程序使用过程中速度还挺快,但是随着数据量的不停的增长,发现程序越来越慢,甚至出现了超时的问题,因此要对程序和数据 ...
- Mysql优化之优化工具profiling
程序员的成长之路 2016-11-23 22:42 Mysql优化之优化工具profiling 前言 mysql优化技术: mysql优化不是做一个操作就可以的优化,它包含很多的细节,需要一点一点的优 ...
- QRowTable表格控件(四)-效率优化之-优化数据源
目录 一.开心一刻 二.问题分析 三.重写数据源 1.自己存储数据 2.重写data接口 四.比较 五.相关文章 原文链接:QRowTable表格控件(四)-效率优化之-优化数据源 一.开心一刻 一程 ...
- 知识点整理-mysql怎么查看优化器优化后的sql
背景 1.新建两张表 CREATE TABLE t1 (m1 )); CREATE TABLE t2 (m2 )); 2.插入些数据 INSERT INTO t1 VALUES(, , , 'c'); ...
- Android 性能优化 ---- 启动优化
Android 性能优化 ---- 启动优化 1.为什么要进行启动优化 一款应用的第一印象很重要,第一印象往往决定了用户的去留.打开一款应用,如果速度很快,很顺畅,那么很容易让人觉得这款应用背后的技术 ...
- Android 性能优化---布局优化
Android 性能优化---布局优化 Android 布局绘制原理 布局加载过程 setContentView() --> inflate() -- > getLayout()(I/O操 ...
随机推荐
- Android Studio —— java.lang.VerifyError: Verifier rejected class 问题解决
用as开发过程中遇见问题app闪退 log如下图: 解决: File—Settings: 点击Apply—OK重新运行即可
- linux 开机报错,error grub_efi_find_mmap_size not find
开机报错,差点以为要重装系统了 搜到了官方的重建引导的教程 修复了错误 https://wiki.manjaro.org/index.php/Restore_the_GRUB_Bootloader#F ...
- lua模块注册
Lua自带的模块并不多,好处就是Lua足够的小,毕竟它的设计目标是定位成一个嵌入式的轻量级语言的. 相关的函数index2adr static TValue *index2adr (lua_State ...
- elementUI实现前端分页
按照他的文档来写分页,最主要的是el-table里面展示的数据怎么处理 <el-table :data="AllCommodityList.slice((currentPage-1)* ...
- c++面向对象程序设计总结(类的使用)
本篇算是学习c++有关类的知识的一些易错点吧..... 并不是特别详细,以后会更新吧.... 几点并不关于类的东西 1.函数模板,用虚拟类型来实现模板的功能 #include<iostream& ...
- Docker 在Windows上的安装
1. 软件从Docker官网下载,进行安装,安装后,能看到如下界面. 2. 安装后,查看Docker 版 本信息. 3. 配置加速器 (1)选择setting. (2)依次选择,并填写自己的加速器地址 ...
- time命令详情
基础命令学习目录首页 原文链接:https://blog.csdn.net/adaptiver/article/details/6596143?utm_source=blogxgwz3 linux下t ...
- Ubuntu16.04Server版离线安装Nginx1.8.1+Mysql5.7.23+Python3.6.2
nginx1.8.1 1.安装前准备工作 1.1.检查系统版本,确认源码编译所依赖的环境,提前下载好压缩包. 整个环境都是使用root权限安装,系统版本为server版的ubuntu16.04.4 r ...
- mysql实现oracle sequence方案
转自: http://blog.csdn.net/javaGirlOne/article/details/47256183 背景:先总结一下MYSQL 自增长与ORACLE 序列的区别: 自增长只能用 ...
- java第四次实验报告
课程:Java程序与设计 班级:1352 姓 名:池彬宁 小组成员: 20135212池彬宁 20135208贺邦 学号:20135212 成绩: 指导教师:娄嘉鹏 ...