模数是998244353的话好像NTT可以更快。

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 3e5 + 51, MOD = 998244353, G = 3, INVG = 332748118;
int exponent, fd, cnt = 1, limit = -1, rres, ptr;
int rev[MAXN], f[MAXN], g[MAXN], tmp[MAXN], tmp2[MAXN], tmp3[MAXN], tbm[MAXN];
int res[MAXN], base[MAXN], fail[MAXN];
ll delta[MAXN]; inline int read() {
int num = 0;
bool neg = false;
char ch = getchar();
while(!isdigit(ch) && ch != '-')
ch = getchar();
if(ch == '-')
neg = true, ch = getchar();
while(isdigit(ch))
num = (num << 3) + (num << 1) + (ch - '0'), ch = getchar();
return neg ? -num : num;
} inline int qpow(ll x, int n) {
ll res = 1;
for(; n; x = x * x % MOD, n >>= 1)
if(n & 1)
res = res * x % MOD;
return res;
} inline void NTT(int *cp, int cnt, int inv) {
int cur = 0, res = 0;
for(int i = 0; i < cnt; i++)
if(i < rev[i])
swap(cp[i], cp[rev[i]]); for(int i = 2; i <= cnt; i <<= 1) {
cur = i >> 1, res = qpow(inv == 1 ? G : INVG, (MOD - 1) / i);
for(int *p = cp; p != cp + cnt; p += i) {
ll w = 1;
for(int j = 0; j < cur; j++) {
int t = w * p[j + cur] % MOD, t2 = p[j];
p[j + cur] = (t2 - t + MOD) % MOD, p[j] = (t2 + t) % MOD;
w = w * res % MOD;
}
}
} if(inv == -1) {
int invl = qpow(cnt, MOD - 2);
for(int i = 0; i <= cnt; i++)
cp[i] = (ll) cp[i] * invl % MOD;
}
} inline void inv(int fd, int *f, int *res) {
static int tmp[MAXN];
if(fd == 1) {
res[0] = qpow(f[0], MOD - 2);
return;
}
inv((fd + 1) >> 1, f, res);
int cnt = 1, limit = -1;
while(cnt < (fd << 1))
cnt <<= 1, limit++;
for(int i = 0; i < cnt; i++) {
tmp[i] = i < fd ? f[i] : 0;
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << limit);
}
NTT(tmp, cnt, 1), NTT(res, cnt, 1);
for(int i = 0; i < cnt; i++)
res[i] = 1ll * (2 - 1ll * tmp[i] * res[i] % MOD + MOD) % MOD * res[i] % MOD;
NTT(res, cnt, -1);
for(int i = fd; i < cnt; i++)
res[i] = 0;
} inline void mod(int *f) {
static int tmp[MAXN], q[MAXN];
int deg = fd << 1;
while(!f[--deg]);
if(deg < fd)
return; for(int i = 0; i < cnt; i++)
tmp[i] = i <= deg ? f[i] : 0;
reverse(tmp, tmp + 1 + deg);
for(int i = deg + 1 - fd; i <= deg; tmp[i] = 0, i++);
NTT(tmp, cnt, 1);
for(int i = 0; i < cnt; q[i] = (ll)tmp[i] * tmp3[i] % MOD, i++);
NTT(q, cnt, -1);
for(int i = 0; i < cnt; tmp[i] = 0, q[i] = i <= deg - fd ? q[i] : 0, i++);
reverse(q, q + 1 + deg - fd), NTT(q, cnt, 1);
for(int i = 0; i < cnt; tmp[i] = (ll)q[i] * g[i] % MOD, i++);
NTT(tmp, cnt, -1);
for(int i = 0; i < fd; f[i] = (f[i] - tmp[i] + MOD) % MOD, i++);
for(int i = 0; i < cnt; q[i] = tmp[i] = 0, f[i] = i < fd ? f[i] : 0, i++);
} vector<ll>bmf[MAXN];
inline void BerlekampMassey(int length, int *base, int *res) {
int cur = 0;
for(int i = 1; i <= length; i++) {
ll curr = base[i];
for(int j = 0; j < bmf[cur].size(); j++) {
curr = (curr - (ll)base[i - j - 1] * bmf[cur][j] % MOD) % MOD;
}
delta[i] = curr;
if(!delta[i]) {
continue;
}
fail[cur] = i;
if(!cur) {
bmf[++cur].resize(i), delta[i] = base[i];
continue;
}
int id = cur - 1, x = bmf[id].size() - fail[id] + i;
for(int j = 0; j < cur; j++) {
if(i - fail[j] + bmf[j].size() < x) {
id = j, x = i - fail[j] + bmf[j].size();
}
}
bmf[cur + 1] = bmf[cur], cur++;
while(bmf[cur].size() < x) {
bmf[cur].push_back(0);
}
ll mul = (ll)delta[i] * qpow(delta[fail[id]], MOD - 2) % MOD;
bmf[cur][i - fail[id] - 1] = (ll)(bmf[cur][i - fail[id] - 1] + mul) % MOD;
for(int j = 0; j < bmf[id].size(); j++) {
int t = (ll)mul * bmf[id][j] % MOD;
bmf[cur][i - fail[id] + j] = (bmf[cur][i - fail[id] + j] - t + MOD) % MOD;
}
}
ptr = cur;
for(int i = 0; i < bmf[cur].size(); i++) {
res[i + 1] = (bmf[cur][i] % MOD + MOD) % MOD;
}
}
int main() {
#ifdef Yinku
freopen("Yinku.in", "r", stdin);
#endif // Yinku
fd = read(), exponent = read();
for(int i = 0; i < fd; i++)
tbm[i + 1] = f[i] = (read() + MOD) % MOD; BerlekampMassey(fd, tbm, tmp);
for(int i = 1, ci = bmf[ptr].size(); i <= ci; i++)
printf("%d%c", tmp[i], " \n"[i == ci]); for(int i = 1; i <= fd; g[fd - i] = MOD - tmp[i], i++);
g[fd] = 1;
for(int i = 0; i <= fd; i++)
tmp2[i] = g[i]; reverse(tmp2, tmp2 + 1 + fd), inv(fd << 1, tmp2, tmp3);
for(int i = 0; i <= fd; i++)
tmp2[i] = 0; while(cnt < (fd << 2))
cnt <<= 1, limit++; for(int i = 0; i < cnt; i++)
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << limit); NTT(g, cnt, 1), NTT(tmp3, cnt, 1), base[1] = res[0] = 1;
while(exponent) {
if(exponent & 1) {
NTT(res, cnt, 1), NTT(base, cnt, 1);
for(int i = 0; i < cnt; i++)
res[i] = (ll)res[i] * base[i] % MOD;
NTT(res, cnt, -1), NTT(base, cnt, -1), mod(res);
}
NTT(base, cnt, 1);
for(int i = 0; i < cnt; i++)
base[i] = (ll)base[i] * base[i] % MOD;
NTT(base, cnt, -1), mod(base), exponent >>= 1;
}
for(int i = 0; i < fd; i++)
rres = (rres + (ll)res[i] * f[i] % MOD) % MOD;
printf("%d\n", rres);
}

模板 - 线性递推BM的更多相关文章

  1. [模板]线性递推+BM

    暴力版本: #include<bits/stdc++.h> #define mod 998244353 using namespace std; typedef long long int ...

  2. LG5487 【模板】线性递推+BM算法

    [模板]线性递推+BM算法 给出一个数列 \(P\) 从 \(0\) 开始的前 \(n\) 项,求序列 \(P\) 在\(\bmod~998244353\) 下的最短线性递推式,并在 \(\bmod~ ...

  3. 线性递推BM模板

    #include <cstdio> #include<iostream> #include <cstring> #include <cmath> #in ...

  4. Berlekamp Massey算法求线性递推式

    BM算法求求线性递推式   P5487 线性递推+BM算法   待AC.   Poor God Water   // 题目来源:ACM-ICPC 2018 焦作赛区网络预赛 题意   God Wate ...

  5. BM求线性递推模板(杜教版)

    BM求线性递推模板(杜教版) BM求线性递推是最近了解到的一个黑科技 如果一个数列.其能够通过线性递推而来 例如使用矩阵快速幂优化的 DP 大概都可以丢进去 则使用 BM 即可得到任意 N 项的数列元 ...

  6. 【模板】BM + CH(线性递推式的求解,常系数齐次线性递推)

    这里所有的内容都将有关于一个线性递推: $f_{n} = \sum\limits_{i = 1}^{k} a_{i} * f_{n - i}$,其中$f_{0}, f_{1}, ... , f_{k ...

  7. HDU - 6172:Array Challenge (BM线性递推)

    题意:给出,三个函数,h,b,a,然后T次询问,每次给出n,求sqrt(an); 思路:不会推,但是感觉a应该是线性的,这个时候我们就可以用BM线性递推,自己求出前几项,然后放到模板里,就可以求了. ...

  8. 2018 焦作网络赛 L Poor God Water ( AC自动机构造矩阵、BM求线性递推、手动构造矩阵、矩阵快速幂 )

    题目链接 题意 : 实际上可以转化一下题意 要求求出用三个不同元素的字符集例如 { 'A' .'B' .'C' } 构造出长度为 n 且不包含 AAA.BBB CCC.ACB BCA.CAC CBC ...

  9. 牛客多校第九场 A The power of Fibonacci 杜教bm解线性递推

    题意:计算斐波那契数列前n项和的m次方模1e9 题解: $F[i] – F[i-1] – F[i-2] = 0$ $F[i]^2 – 2 F[i-1]^2 – 2 F[i-2]^2 + F[i-3] ...

随机推荐

  1. Java:字符编码

    常用的字符编码 UFT-8 ISO-8859-1 GBK/GBK2312

  2. ORM详解,ORM Object relation mapping (对象关系映射)

  3. System.currentTimeMillis和System.nanoTime()

    ns(nanosecond):纳秒, 时间单位.一秒的10亿分之一,即等于10的负9次方秒.常用作 内存读写速度的单位.  1纳秒=0.000001 毫秒  1纳秒=0.00000 0001秒 jav ...

  4. mysql AND运算符 语法

    mysql AND运算符 语法 作用:在 WHERE 子语句中把两个或多个条件结合起来.佛山大理石方尺 语法:SELECT * FROM 表名 WHERE 字段1 运算符 值 AND 字段2 运算符 ...

  5. php大文件上传解决方案

    PHP用超级全局变量数组$_FILES来记录文件上传相关信息的. 1.file_uploads=on/off 是否允许通过http方式上传文件 2.max_execution_time=30 允许脚本 ...

  6. [洛谷3934]P3934 Nephren Ruq Insania题解

    先放个奈芙莲 解法 看到这种题目就知道是欧拉降幂,然后根据某玄学证明,递归欧拉降幂从l到r不会超过\(\Theta(log_n)\),所以直接递归解决,然后区间修改直接树状数组维护一下 然后就A了 代 ...

  7. Leetcode 8. String to Integer (atoi)(模拟题,水)

    8. String to Integer (atoi) Medium Implement atoi which converts a string to an integer. The functio ...

  8. 按ECS退出全屏模式

    <!DOCTYPE html><html><meta http-equiv="Content-Type" content="text/htm ...

  9. MySQL慢日志分析之pt-query-digest

    http://www.php.cn/mysql-tutorials-357655.html 监控慢日志: pt-query-digest 切割分析慢日志 anemometer 删掉垃圾查询 pt-ki ...

  10. 008-Spring Boot @EnableAutoConfiguration深入分析、内部如何使用EnableAutoConfiguration

    一.EnableAutoConfiguration 1.EnableAutoConfiguration原理 springboot程序入口使用注解@SpringBootApplication,Sprin ...