随（rand）：原根，循环矩阵，dp

20分特判，一个puts("1")一个快速幂，不讲。

50%算法：

上次就讲了，可是应该还是有像 xuefen某或 Dybal某一样没听的。

用a×inv(b)%mod来表示分数的时候，这个分数值可加可乘（有空证明）

像是一个dp题啊。

初状态是1方案数为1，然后做乘法转移不就好了嘛？

设dp[i][j]表示进行了i次操作后所得的值为j

dp[i][j*a[k]%mod]+=dp[i-1][j];

复杂度O(mod²×m)

 #include<iostream>

 #include<cstdio>

 #include<cmath>

 #include<algorithm>

 #include<queue>

 #include<vector>

 #include<string>

 #include<cstring>

 #define int long long

 #define m(a) memset(a,0,sizeof(a))

 #define AA cout<<"Alita"<<endl

 using namespace std;

 const int mod=1e9+;

 int ans,S,n,m,p,v[],a[],f[][],g[][],tmp[][];

 int poww(int x,int y,int z)

 {

         int sum=;

         while(y)

         {

                 if(y&) sum=sum*x%z;

                 y>>=;

                 x=x*x%z;

         }

         return sum;

 }

 void X_g()

 {

         memset(tmp,,sizeof(tmp));

         for(int i=;i<p;i++)

         {

                 for(int j=;j<p;j++)

                 {

                         (tmp[][i]+=g[][j]*f[j][i]%mod)%=mod;

                 }

         }

         for(int i=;i<p;i++)

         {

                 g[][i]=tmp[][i];

         }

 }

 void X_f()

 {

         memset(tmp,,sizeof(tmp));

         for(int i=;i<p;i++)

         {

                 for(int j=;j<p;j++)

                 {

                         for(int k=;k<p;k++)

                         {

                                 (tmp[i][j]+=f[i][k]*f[k][j]%mod)%=mod;

                         }

                 }

         }

         for(int i=;i<p;i++)

         {

                 for(int j=;j<p;j++)

                 {

                         f[i][j]=tmp[i][j];

                 }

         }

 }

 void work(int y)

 {

         while(y)

         {

                 if(y&) X_g();

                 y>>=;

                 X_f();

         }

 }

 signed main()

 {

         //freopen("1.in","r",stdin);

         //freopen("1.out","w",stdout);

         scanf("%lld%lld%lld",&n,&m,&p);

         if(p==){puts("");return ;}

         for(int i=;i<=n;i++) scanf("%lld",&a[i]);

         if(n==){printf("%lld",poww(a[],m,p));return ;}

         S=poww(n,mod-,mod);

         for(int i=;i<=n;i++)

         {

                 (v[a[i]%p]+=S)%=mod;

         }

         g[][]=;

         for(int j=;j<p;j++)

         {

                 for(int k=;k<p;k++)

                 {

                         f[j][j*k%p]+=v[k];

                 }

         }

         work(m);

         for(int i=;i<p;i++)

         {

                 (ans+=g[][i]*i%mod)%=mod;

         }

         printf("%lld",ans);

         return ;

 }

Dybala的50分代码（已征得同意后转载）

因为我直接没想这个这么暴力的dp，看到题目的m已经破1e8了那么要么复杂度与之无关要么把它log掉

理论80%算法：

这题m又不是一个计算参数，复杂度不太可能与之无关，尝试log？

带log的dp。。。矩阵快速幂啊！

可以发现dp的第二维并不大，是mod级别，矩阵乘mod³貌似勉强可以接受

O(mod³×log₂m)的复杂度。我也不知道题解为什么说能得80分。

略微一算，知道复杂度已经略微超过极限，卡常？没有用，还是50分。

个人认为把矩阵快速幂和暴力dp的得分设置成一样不太道德。

到现在还有人不会用矩阵快速幂优化dp啊。。。这。。。我该怎么讲？

ans矩阵用来更新答案，base矩阵是快速幂的基底。

普通快速幂是这个样子的：for(;t;t>>=1,base=base*base){if(t&1)ans*=base;base*=base;}

换成矩阵也是一样的啊：for(;t;t>>=1){if(t&1)mult_ans();mult_base();}

只不过是两个矩阵乘法函数而已。

提醒：包括用重载运算符的矩阵乘，传参时要带上‘&’符号，不然有时会TLE/RE

base矩阵的构造也很简单，对于每一个可能被选到的数a[i]，枚举乘之前的数j。

base[j][j*a[i]%p]+=1;（这里是求解总方案书数，如果是概率打法要把1改成概率）

就是能从a转移到b的话，base[a][b]就有值，是方案的话就是1，算概率的话就是概率。

ans矩阵可以弄成一维数组，能略快一些。这题初始为1，那么ans[1]=1就好了。

注意：代码中的p是原题中的mod，而代码中的mod是1e9+7。我是概率打法

 #include<cstdio>

 #define int long long

 #define mod 1000000007ll

 int n,m,p,base[][],ans[],res[][],a[],ANS;

 int pow(int bbase,int t,int modd,int aans=){

     for(;t;t>>=,bbase=bbase*bbase%modd)if(t&)aans=aans*bbase%modd;

     return aans;

 }

 void mult_base(){

     for(int i=;i<p;++i)for(int j=;j<p;++j)for(int k=;k<p;++k)(res[i][j]+=base[i][k]*base[k][j])%=mod;

     for(int i=;i<p;++i)for(int j=;j<p;++j)base[i][j]=res[i][j],res[i][j]=;

 }

 void mult_ans(){

     for(int i=;i<p;++i)for(int j=;j<p;++j)(res[][j]+=ans[i]*base[i][j])%=mod;

     for(int i=;i<p;++i)ans[i]=res[][i],res[][i]=;

 }

 signed main(){

     scanf("%lld%lld%lld",&n,&m,&p);

     if(n==){

         scanf("%lld",&a[]);

         printf("%lld\n",pow(a[],m,p));return ;

     }

     ans[]=;const int P=pow(n,mod-,mod);//概率，即1/n

     for(int i=;i<=n;++i)scanf("%lld",&a[i]),a[i]%=p;

     for(int i=;i<=n;++i)for(int j=;j<p;++j)(base[j][j*a[i]%p]+=P)%=mod;

     for(;m;m>>=){if(m&)mult_ans();mult_base();}

     for(int i=;i<p;++i)(ANS+=ans[i]*i)%=mod;

     printf("%lld\n",ANS);

 }

卡死常数还是50分

100%算法：

想象一下如果题目改一下，你是随机选择数加上它而不是乘，该怎么做？

原始dp方程：dp[i][(j+a[k])%mod]+=dp[i-1][j];

同理，构造矩阵。

base[i][(i+a[j])%mod]=1;//或者概率

写几个不太大的样例，把矩阵写出来，你会发现，它是一个循环矩阵。

这个加法类型的转移矩阵基本上都是循环矩阵（对于不同的被转移数，加数都一样）

回到这道题。

首先从复杂度上考虑，也许可以猜出来这是个循环矩阵。

可是那个诡异的乘法形式并不是循环的，虽然它对于不同的被转移数，乘数都一样。

如果它也是一个加法，该多好啊。

没办法，它是个乘法，我们要接受这个现实。

但是，这并不能阻碍我们把它强制弄成加法。

看看孙金宁老师的叮嘱：啊，什么原根，啊，几次方，啊什么取到所有值。。。（困）

次方？乘法？加法？欧拉定理？

x^a× x^b=x^a+b

诶，这里有加法了！这样可以把乘法换成加法。

动用一下欧拉定理：

x^a× x^b=x^{(a+b)%(mod-1)}

如果题目的所有输入都是x的几次方，就很好做了。

考虑：刚开始一个数是a⁰,你可以从a⁴,a⁷,a²³里面随机选数把它乘起来，值对mod取模，得到ans，求最后ans的期望

这个问题就相当于：考虑：刚开始一个数是0,你可以从4，7，23里面随机选数把它加起来，值对mod-1取模，求最后a^ans%mod的期望

好做好做！就是普通的加法dp，循环矩阵肝它！

但是。。。这个a是多少呢？

继续听孙金宁的数学课。原根啥啥啥的。。。

原根？啥？原根？哦。好吧。原根就原根吧。

如果你比我聪明，你可能会直接发现，既然原根的次方值能够取遍1～mod-1的所有数，那么这些数就都可以用原根唯一确定的表示出来。那么就可以把题目的所有数都用原根表示，然后当成加法dp来做。你就A了。

如果你没我聪明，那么就相当与你和我一样聪明。

那么如果咱们一样聪明，诶，那好啊，咱们都想不到。既然它一直在念叨原根，那就试试拿原根表示呗。

那么首先我们需要求出原根。用题目给出的那个充要条件很好求。

for(int i=;i<p;i++){

    int now=,j;

    for(j=;j<p-;++j)

        if(al[now]==-)//像它描述里说的一样，不能出现重复的，因为它要在mod-1次里取到mod-1个不同值，故不能重复

            al[now]=j,//记录下now这个值唯一确定的对应着i的几次幂

            qpow[j]=now,//记录下来i的j次幂是几，以后会用到

            now=now*i%p;//now是i的j次幂，j++，更新

        else break;

    if(j==p-){g=i;break;}//如果j成功的走完了，没有被中途break掉，那么i就是原根。

    else for(int i=;i<p;++i)al[i]=-;//清空

}

然而我这么求是用了它说的第一条，这样的话可以顺便求出qpow和al数组里面的值。

al数组不仅是用来标记是否出现过的。如果它出现过，还记录了它对应的是原根g的几次幂。

接下来，我们就拥有了1～mod-1里面每个值和g的几次幂间的双向映射。

那么就把原问题映射成加法dp，循环矩阵干他，再映射回来统计答案即可。

 #include<cstdio>

 #define int long long

 #define mod 1000000007ll

 int n,m,p,base[],ans[],res[],a[],ANS;

 int al[],g,qpow[];

 int pow(int bbase,int t,int modd,int aans=){

     for(;t;t>>=,bbase=bbase*bbase%modd)if(t&)aans=aans*bbase%modd;

     return aans;

 }

 void mult_base(){

     for(int i=;i<p;++i)for(int j=;j<p;++j)(res[j]+=base[i]*base[(j-i+p)%p])%=mod;

     for(int i=;i<p;++i)base[i]=res[i],res[i]=;

 }

 void mult_ans(){

     for(int i=;i<p;++i)for(int j=;j<p;++j)(res[j]+=ans[i]*base[(j-i+p)%p])%=mod;

     for(int i=;i<p;++i)ans[i]=res[i],res[i]=;

 }

 signed main(){

     scanf("%lld%lld%lld",&n,&m,&p);

     ans[]=;const int P=pow(n,mod-,mod);

     for(int i=;i<=;++i)al[i]=-;

     for(int i=;i<p;i++){

         int now=,j;

         for(j=;j<p-;++j)

             if(al[now]==-)al[now]=j,qpow[j]=now,now=now*i%p;

             else break;

         if(j==p-){g=i;break;}

         else for(int i=;i<p;++i)al[i]=-;

     }p--;

     for(int i=;i<=n;++i)scanf("%lld",&a[i]),a[i]=al[a[i]];

     for(int i=;i<=n;++i)(base[a[i]]+=P)%=mod;

     for(;m;m>>=){if(m&)mult_ans();mult_base();}

     for(int i=;i<p;++i)(ANS+=ans[i]*qpow[i])%=mod;

     printf("%lld\n",ANS);

 }

于倬浩：然后你就愉快的拿到了100分的好成绩

随（rand）：原根，循环矩阵，dp的更多相关文章

2018.09.27 bzoj2510: 弱题（概率dp+循环矩阵优化）
传送门简单概率dp. 显然每次转移的式子可以用一个矩阵表示出来: 这个是循环矩阵. 因此只用维护第一行快速幂一波就行了. 代码: #include<bits/stdc++.h> #def ...
bzoj 2510: 弱题概率期望dp+循环矩阵
题目: Description 有M个球,一开始每个球均有一个初始标号,标号范围为1-N且为整数,标号为i的球有ai个,并保证Σai = M. 每次操作等概率取出一个球(即取出每个球的概率均为1/M) ...
[bzoj2510]弱题 (循环矩阵优化dp)
Description 有M个球,一开始每个球均有一个初始标号,标号范围为1-N且为整数,标号为i的球有ai个,并保证Σai = M. 每次操作等概率取出一个球(即取出每个球的概率均为1/M),若这个 ...
【循环矩阵乘优化DP】BZOJ 2510 弱题
题目大意有 $M$ 个球,一开始每个球均有一个初始标号,标号范围为 $1$ - $N$ 且为整数,标号为 $i$ 的球有 $a_i$ 个,并保证 $\sum a_i = M$ ...
Luogu3702 SDOI2017 序列计数矩阵DP
传送门不考虑质数的条件,可以考虑到一个很明显的$DP:$设$f_{i,j}$表示选$i$个数,和$mod\ p=j$的方案数,显然是可以矩阵优化$DP$的. 而且转移矩阵是循环矩阵,所以可以只用第一 ...
BZOJ 4204 && BZOJ 2510 循环矩阵
n^3logn非常显然.所以要用一种因为这个矩阵是一个循环矩阵,所以只要知道第一行就可以知道所有行了. C[i][j]=C[i-1][j-1]; #include <iostream> # ...
LA 3704 (矩阵快速幂循环矩阵) Cellular Automaton
将这n个格子看做一个向量,每次操作都是一次线性组合,即vn+1 = Avn,所求答案为Akv0 A是一个n*n的矩阵,比如当n=5,d=1的时候: 不难发现,A是个循环矩阵,也就是将某一行所有元素统一 ...
bzoj 2510: 弱题循环矩阵
2510: 弱题 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 124 Solved: 61[Submit][Status][Discuss] De ...
UVA 1386 - Cellular Automaton(循环矩阵)
UVA 1386 - Cellular Automaton option=com_onlinejudge&Itemid=8&page=show_problem&category ...

随机推荐

[Redis] Redis的基本数据结构
key-value 通过key获取或设置value SET key value GET key SET server:name "fido" GET server:name SET ...
python与数据存储
思考:为什么使用计算机? 存储数据,计算数据思考:数据存在哪里? 数据存在内存里内存:内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁.计算机中所有程序的运行都是在内存中进行的,因此内存的 ...
Java基础学习(八) - 多线程
理解线程进程是指一个内存中运行的应用程序,系统运行一个程序即是一个进程从创建,运行,结束的过程. 线程是进程中的一个执行单元,负责当前进程中程序的执行,一个进程中至少有一个线程. 多线程的特点是并发 ...
Java 2019 生态圈使用报告，这结果你赞同吗？
这是国外一机构调查了 7000 名开发者得出来的 Java 2019 年生态圈工具使用报告,主要调查了 Java 版本.开发框架.web 服务器等使用情况.虽然只有 7000 名开发者参与调查,这数目 ...
Swoole4-swoole创建Mysql连接池
一 .什么是mysql连接池场景:每秒同时有1000个并发,但是这个mysql同时只能处理400个连接,mysql会宕机. 解决方案:连接池,这个连接池建立了200个和mysql的连接,这1000个 ...
Tomcat7.0.40注册到服务启动报错error Code 1 +connector attribute sslcertificateFile must be defined when using ssl with apr
Tomcat7.0.40 注册到服务启动遇到以下几个问题: 1.启动报错errorCode1 查看日志如下图: 解决办法: 这个是因为我的jdk版本问题,因为电脑是64位,安装的jdk是32位的所以会 ...
conversion function——转换函数
类型转换函数与 explicit关键字 1.类型转换函数在C++中,可以使用构造函数将一个指定类型的数据转换为类的对象,也可以使用类型转换函数 (type conversion function) ...
MySQL学习（一）索引的基本认识
MySQL中,所有的数据类型都可以被索引,包括普通索引,唯一性索引,全文索引,单列索引,多列索引和空间索引等. 额外的:我已知的自动创建索引的时机:创建主键,唯一,外键约束的时候一.索引简介 1.1 ...
Making Dishes （P3243 [HNOI2015]菜肴制作）
Background\text{Background}Background I've got that Luogu Dialy has been \text{I've got that Luogu D ...
Halcon一日一练：图像采集设备的基本参数
因操作图像处理之前,需要对图像进行采集.采集图像,我们首先要确定的是图像的像素和采集的效率.这些都需要对设备进行配置与操作.现实情况是图像设备有各自不同的采集方式,配置也各不相同.这就需要设备提供商提 ...

随（rand）：原根，循环矩阵，dp

随（rand）：原根，循环矩阵，dp的更多相关文章

随机推荐

热门专题