【XSY2524】唯一神 状压DP 矩阵快速幂 FFT
题目大意
给你一个网格,每个格子有概率是\(1\)或是\(0\)。告诉你每个点是\(0\)的概率,求\(1\)的连通块个数\(\bmod d=0\)的概率。
最开始所有格子的概率相等。有\(q\)次修改,每次修改一个格子的概率。要求输出初始时和每次修改后的概率。
\(n\leq 200000,m\leq 3,d\leq 10,q\leq 1000\)
题解
很容易想到状压DP:前\(i\)行在第\(i\)行的状态为\(j\)时连通块个数模\(d=k\)的概率。
当\(m=3\)时每行状态有\(9\)个。
然后用矩阵快速幂+线段树优化。
显然会TLE。
观察下状态转移方程:
\]
容易发现\(\Delta _k=k'-k\)与\(j\)无关。设
\]
\(g\)的每次转移就等于乘上一个多项式。
而且这是循环卷积(长度为\(d\))。
我们可以在最开始先做一遍长度为\(d\)的DFT(直接暴力\(d^2\)),每次询问时把点值加起来做一遍IDFT,就可以得到多项式的常数项,也就是说我们想要的答案。
时间复杂度:\(O(qs^3d\log n)\)
代码
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cstdlib>
#include<ctime>
#include<utility>
#include<cmath>
#include<functional>
#include<map>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int,int> pii;
typedef pair<ll,ll> pll;
void sort(int &a,int &b)
{
if(a>b)
swap(a,b);
}
void open(const char *s)
{
#ifndef ONLINE_JUDGE
char str[100];
sprintf(str,"%s.in",s);
freopen(str,"r",stdin);
sprintf(str,"%s.out",s);
freopen(str,"w",stdout);
#endif
}
int rd()
{
int s=0,c;
while((c=getchar())<'0'||c>'9');
do
{
s=s*10+c-'0';
}
while((c=getchar())>='0'&&c<='9');
return s;
}
void put(int x)
{
if(!x)
{
putchar('0');
return;
}
static int c[20];
int t=0;
while(x)
{
c[++t]=x%10;
x/=10;
}
while(t)
putchar(c[t--]+'0');
}
int upmin(int &a,int b)
{
if(b<a)
{
a=b;
return 1;
}
return 0;
}
int upmax(int &a,int b)
{
if(b>a)
{
a=b;
return 1;
}
return 0;
}
const ll p=370137601;
const ll g=37;
ll fp(ll a,ll b)
{
ll s=1;
for(;b;b>>=1,a=a*a%p)
if(b&1)
s=s*a%p;
return s;
}
struct mat
{
ll a[10][10];
mat()
{
memset(a,0,sizeof a);
}
ll *operator [](int x)
{
return a[x];
}
};
int sz;
mat operator *(mat &a,mat &b)
{
mat c;
int i,j,k;
for(i=1;i<=sz;i++)
for(j=1;j<=sz;j++)
{
__int128 s=0;
for(k=1;k<=sz;k++)
s+=__int128(a[i][k])*b[k][j];
c[i][j]=s%p;
}
return c;
}
int level[200010];
mat w[11][20];
struct seg
{
struct node
{
mat *s;
int l,r,ls,rs;
};
node a[270000];
int cnt;
int rt;
void build(int &p,int l,int r,int k)
{
p=++cnt;
a[p].l=l;
a[p].r=r;
a[p].s=&w[k][level[r-l+1]];
if(l==r)
return;
int mid=(l+r)>>1;
build(a[p].ls,l,mid,k);
build(a[p].rs,mid+1,r,k);
}
void insert(int p,int x,mat &v)
{
if(a[p].l==a[p].r)
{
a[p].s=new mat;
*a[p].s=v;
return;
}
int mid=(a[p].l+a[p].r)>>1;
if(x<=mid)
insert(a[p].ls,x,v);
else
insert(a[p].rs,x,v);
a[p].s=new mat;
(*a[p].s)=(*a[a[p].ls].s)*(*a[a[p].rs].s);
}
};
seg a[11];
int n,m,k,q;
ll c[200010][4];
int dd[10][10];
int bb[10][10];
void get(ll *a,int x,int a1,int a2)
{
static ll b[10];
int i;
for(i=0;i<k;i++)
a[i]=0;
if(m==1)
{
b[1]=c[x][1];
b[2]=1-c[x][1];
a[dd[a1][a2]]=b[a2];
// for(l=0;l<k;l++)
// for(i=1;i<=sz;i++)
// for(j=1;j<=sz;j++)
// s[id(l,i)][id((l+dd[i][j])%k,j)]=b[j];
}
else if(m==2)
{
b[1]=c[x][1]*c[x][2]%p;
b[2]=(1-c[x][1])*c[x][2]%p;
b[3]=c[x][1]*(1-c[x][2])%p;
b[4]=(1-c[x][1])*(1-c[x][2])%p;
a[dd[a1][a2]]=b[a2];
// for(l=0;l<k;l++)
// for(i=1;i<=sz;i++)
// for(j=1;j<=sz;j++)
// s[id(l,i)][id((l+dd[i][j])%k,j)]=b[j];
}
else
{
b[1]=c[x][1]*c[x][2]%p*c[x][3]%p;
b[2]=(1-c[x][1])*c[x][2]%p*c[x][3]%p;
b[3]=c[x][1]*(1-c[x][2])%p*c[x][3]%p;
b[4]=c[x][1]*c[x][2]%p*(1-c[x][3])%p;
b[5]=(1-c[x][1])*(1-c[x][2])%p*c[x][3]%p;
b[6]=c[x][1]*(1-c[x][2])%p*(1-c[x][3])%p;
b[7]=(1-c[x][1])*(1-c[x][2])%p*(1-c[x][3])%p;
b[8]=b[9]=(1-c[x][1])*c[x][2]%p*(1-c[x][3])%p;
if(!bb[a1][a2])
a[dd[a1][a2]]=b[a2];
// for(l=0;l<k;l++)
// for(i=1;i<=sz;i++)
// for(j=1;j<=sz;j++)
// if(!bb[i][j])
// s[id(l,i)][id((l+dd[i][j])%k,j)]=b[j];
}
}
ll w1[200],w2[200];
void dft(ll *a)
{
static ll s[20];
int i,j;
for(i=0;i<k;i++)
{
s[i]=0;
for(j=0;j<k;j++)
s[i]=(s[i]+a[j]*w1[i*j])%p;
}
for(i=0;i<k;i++)
a[i]=s[i];
}
void idft(ll *a)
{
static ll s[20];
int i,j;
for(i=0;i<k;i++)
{
s[i]=0;
for(j=0;j<k;j++)
s[i]=(s[i]+a[j]*w2[i*j])%p;
}
ll inv=fp(k,p-2);
for(i=0;i<k;i++)
a[i]=s[i]*inv%p;
}
ll d[20];
void query()
{
int i,j;
for(j=1;j<=k;j++)
{
d[j-1]=0;
mat s=*a[j].a[a[j].rt].s;
for(i=1;i<=sz;i++)
d[j-1]=(d[j-1]+s[1][i])%p;
}
idft(d);
ll ans=d[0];
ans=(ans+p)%p;
printf("%lld\n",ans);
}
int main()
{
open("c");
scanf("%d%d%d%d",&n,&m,&k,&q);
int i,j,l,o;
if(m==1)
{
sz=2;
dd[1][2]=1;
}
else if(m==2)
{
sz=4;
dd[1][2]=dd[1][3]=dd[1][4]=1;
dd[2][3]=1;
dd[3][2]=1;
}
else
{
sz=9;
for(i=2;i<=7;i++)
dd[1][i]=1;
dd[1][8]=2;
dd[2][3]=dd[2][4]=dd[2][6]=dd[2][8]=1;
dd[3][2]=dd[3][4]=1;
dd[3][8]=2;
dd[4][2]=dd[4][3]=dd[4][5]=dd[4][8]=1;
dd[5][4]=dd[5][8]=1;
dd[6][2]=dd[6][8]=1;
dd[8][7]=k-1;
dd[8][3]=1;
dd[9][3]=1;
bb[1][9]=bb[2][9]=bb[3][9]=bb[4][9]=bb[5][9]=bb[6][9]=bb[8][9]=1;
bb[7][8]=bb[9][8]=1;
}
w1[0]=w2[0]=1;
w1[1]=fp(g,(p-1)/k);
w2[1]=fp(w1[1],p-2);
for(i=2;i<=k*k;i++)
{
w1[i]=w1[i-1]*w1[1]%p;
w2[i]=w2[i-1]*w2[1]%p;
}
int x,y;
ll p0,q0;
scanf("%lld%lld",&p0,&q0);
p0=p0*fp(q0,p-2)%p;
for(i=1;i<=n;i++)
for(j=1;j<=m;j++)
c[i][j]=p0;
for(i=1;i<=sz;i++)
for(j=1;j<=sz;j++)
{
get(d,1,i,j);
dft(d);
for(l=1;l<=k;l++)
w[l][0][i][j]=d[l-1];
}
for(l=1;l<=k;l++)
for(i=1;i<=18;i++)
w[l][i]=w[l][i-1]*w[l][i-1];
level[0]=-1;
for(i=1;i<=n;i++)
level[i]=level[i>>1]+1;
for(i=1;i<=k;i++)
a[i].build(a[i].rt,1,n,i);
query();
mat now[11];
for(i=1;i<=q;i++)
{
scanf("%d%d%lld%lld",&x,&y,&p0,&q0);
p0=p0*fp(q0,p-2)%p;
c[x][y]=p0;
for(j=1;j<=sz;j++)
for(l=1;l<=sz;l++)
{
get(d,x,j,l);
dft(d);
for(o=1;o<=k;o++)
now[o][j][l]=d[o-1];
}
for(j=1;j<=k;j++)
a[j].insert(a[j].rt,x,now[j]);
query();
}
// printf("sum=%d\n",sum);
return 0;
}
【XSY2524】唯一神 状压DP 矩阵快速幂 FFT的更多相关文章
- HDU 5434 Peace small elephant 状压dp+矩阵快速幂
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=5434 Peace small elephant Accepts: 38 Submissions: ...
- 【BZOJ】2004: [Hnoi2010]Bus 公交线路 状压DP+矩阵快速幂
[题意]n个点等距排列在长度为n-1的直线上,初始点1~k都有一辆公车,每辆公车都需要一些停靠点,每个点至多只能被一辆公车停靠,且每辆公车相邻两个停靠点的距离至多为p,所有公车最后会停在n-k+1~n ...
- BZOJ 4000: [TJOI2015]棋盘( 状压dp + 矩阵快速幂 )
状压dp, 然后转移都是一样的, 矩阵乘法+快速幂就行啦. O(logN*2^(3m)) ------------------------------------------------------- ...
- 2018.09.28 hdu5434 Peace small elephant(状压dp+矩阵快速幂)
传送门 看到n的范围的时候吓了一跳,然后发现可以矩阵快速幂优化. 我们用类似于状压dp的方法构造(1(1(1<<m)∗(1m)*(1m)∗(1<<m)m)m)大小的矩阵. 然后 ...
- BZOJ 2004 公交线路(状压DP+矩阵快速幂)
注意到每个路线相邻车站的距离不超过K,也就是说我们可以对连续K个车站的状态进行状压. 然后状压DP一下,用矩阵快速幂加速运算即可. #include <stdio.h> #include ...
- [BZOJ4000][TJOI2015]棋盘(状压DP+矩阵快速幂)
题意极其有毒,注意给的行列都是从0开始的. 状压DP,f[i][S]表示第i行状态为S的方案数,枚举上一行的状态转移.$O(n2^{2m})$ 使用矩阵加速,先构造矩阵a[S1][S2]表示上一行为S ...
- 瓷砖铺放 (状压DP+矩阵快速幂)
由于方块最多涉及3行,于是考虑将每两行状压起来,dfs搜索每种状态之间的转移. 这样一共有2^12种状态,显然进行矩阵快速幂优化时会超时,便考虑减少状态. 进行两遍bfs,分别为初始状态可以到达的状态 ...
- BZOJ2004 HNOI2010公交线路(状压dp+矩阵快速幂)
由数据范围容易想到矩阵快速幂和状压. 显然若要满足一辆公交车的相邻站台差不超过p,则每相邻p个站台中每辆车至少经过一个站台.可以发现这既是必要的,也是充分的. 开始的时候所有车是相邻的.考虑每次把一辆 ...
- BZOJ4000 TJOI2015棋盘(状压dp+矩阵快速幂)
显然每一行棋子的某种放法是否合法只与上一行有关,状压起来即可.然后n稍微有点大,矩阵快速幂即可. #include<iostream> #include<cstdio> #in ...
随机推荐
- snappy
Snappy 是一个 C++ 的用来压缩和解压缩的开发包.其目标不是最大限度压缩或者兼容其他压缩格式,而是旨在提供高速压缩速度和合理的压缩率.Snappy 比 zlib 更快,但文件相对要大 % 到 ...
- MySQL分页时统计总记录行数并使用limit返回固定数目的记录
需求很简单:假设有一个user表,表中实际上有10000条数据,但是我不知道有多少条,我要从数据库中每次取20条数据显示,那么怎么完成呢? 方案一: 首先执行一个 select count(*) as ...
- h5 文件下载
一.a 标签 移动端不支持 onDownFile= (url, filename) => { const downUrl = `http://10.1.109.123:19092/down/to ...
- C#复习笔记(1)--C#开发的进化史
前言:陆续使用C#已经有一年半的时间.中间做过一些应用,现在为了有更高的提升,决定重新看一遍C# in depth,并总结一些笔记. 一.从简单的数据类型开始 上面是C#1到C#4中的一部分演变历程. ...
- java.util.Collections.copy():列表List浅拷贝
今天同事问我怎样将一个列表(list1)拷贝到另一个列表(list2),然后修改新的列表(list2)不会影响到旧的列表(list1),想了一想,这是深拷贝啊. 可是,除了循环new还有别的办法吗,想 ...
- 1244. Minimum Genetic Mutation
描述 A gene string can be represented by an 8-character long string, with choices from "A", ...
- cpp11_thread线程
一.进程与线程 cpu一般有m核n线程的说法,那么该cpu只能同时运行n个线程(线程中没有sleep). #include <thread> #include <mutex> ...
- servlet ServletContext
一.Servlet简介 1.什么是Servlet Servlet 运行在服务端的Java小程序,是sun公司提供一套规范(接口),用来处理客户端请求.响应给浏览器的动态资源.但servlet的实质就是 ...
- Day 4-2 time & datetime模块
time模块. import time time.time() #输出: 1523195163.140625 time.localtime() # 获取的是操作系统的时间,可以添加一个时间戳参数 # ...
- 校园电商项目3(基于SSM)——配置Maven
步骤一:添加必要文件夹 先在src/main/resources下添加两个文件夹 接着在webapp文件夹下添加一个resources文件夹存放我们的静态网页内容 WEB-INF里的文件是不会被客户端 ...