【题解】 [EZEC-4]求和

对于百分之十的数据：随便过。

下面推式子：

\[\sum_{i=1}^n\sum_{j=1}^n\gcd(i,j)^{i+j}
\]

\[=\sum_{d=1}^n\sum_{i=1}^n\sum_{j=1}^nd^{i+j}[\gcd(i,j)=d]
\]

\[=\sum_{d=1}^n\sum_{i=1}^\frac{n}{d}\sum_{j=1}^\frac{n}{d}d^{d(i+j)}[\gcd(i,j)=1]
\]

\[=\sum_{d=1}^n\sum_{i=1}^\frac{n}{d}\sum_{j=1}^\frac{n}{d}d^{d(i+j)}\sum_{k|\gcd(i,j)}\mu(k)
\]

\[=\sum_{d=1}^n\sum_{k=1}^\frac{n}{d}\mu(k)\sum_{i=1}^\frac{n}{kd}\sum_{j=1}^\frac{n}{kd}d^{kd(i+j)}
\]

令$T=kd:$

\[=\sum_{T=1}^n\sum_{k|T}\mu(k)\sum_{i=1}^\frac{n}{T}\sum_{j=1}^\frac{n}{T}[(\frac{T}{k})^T]^{i+j}
\]

现在的问题在于$\sum_{i=1}^\frac{n}{T}\sum_{j=1}^\frac{n}{T}[(\frac{T}{k})^T]^{i+j}.$

线性递推

以下是@SOSCHINA大佬的思路：

设$g(n)=\sum_{i=1}^n\sum_{j=1}^n k^s.$

枚举$s=i+j.$

则有：

\[g(n)=\sum_{s=2}^{n+1}(s-1)k^s+\sum_{s=n+2}^{2n}(2n-s+1)k^s
\]

\[g(n+1)=\sum_{s=2}^{n+1}(s-1)k^s+\sum_{s=n+2}^{2n+2}(sn+3-s)k^s
\]

\[g(n+1)-g(n)=\sum_{s=n+2}^{2n}2k^s+2k^{2n+1}+k^{2n+2}
\]

第三行就是两行相减。

对第一行的解释：$[2,n+1]$这里的数，每个数作为$i+j$都出现了$x-1$次。因为$i$可以取遍$[1,x-1].$后面的那一些,$[n+2,2n]$会发现$i$最大只能到$n,$不能再取遍$x-1$个值了。此时能取到的应该是$2n-s+1$种。

对于$g(n+1):$这里是把第一个式子的最后一个值移动到了后面那个式子，方便做差。

这时我们可以在小模数的情况下做到$O(n*mod$)的预处理。

化简形式

令$x=(\frac{T}{k})^T.$

则原式为$\sum_{i=1}^\frac{n}{T}\sum_{j=1}^\frac{n}{T} x^{i+j}.$

像不像一个多项式。

它就等于$(x+x^2+...x^\frac{n}{T})^2.$

于是我们可以等比数列求和解出。

剩下的，可以做到$O(n\log n\log mod)$处理出整个式子。

#include<bits/stdc++.h>

using namespace std;

const int MAXN=1500001;

int mod,TT;

bitset<MAXN+1>vis;

int p[MAXN+1],mu[MAXN+1],T[MAXN+1],cnt,n,Ans;

inline int Mod(long long x){

	if(x<0)return x+mod;

    if(x>=mod)return x%mod;

    return x;

}

inline int add(int x,int y) {return Mod(1ll*x+1ll*y+1ll*mod);}

inline int mul(int x,int y) {return Mod(1ll*x*y);}

inline int qpow(int a,int b) {

	if(!b)return 1;

	if(a<=1||b==1)return a;

	a %= mod;

	int res=1;

	while(b) {

		if(b&1)res=mul(res,a);

		a=mul(a,a);

		b>>=1;

	}

	return res;

}

inline int calc(int x,int y){

	if(y==1)return x;

	if(x==1)return y;

	int ans=x;

	int inv=qpow((1-x+mod)%mod,mod-2);

	int fm=(1-qpow(x,y)+mod)%mod;

	ans=mul(ans,mul(fm,inv));

	return ans;

}

inline int Calc(int x,int y){int ans=calc(x,y);return mul(ans,ans);}

int main() {

	scanf("%d",&TT);

	mu[1]=1;

	int N=MAXN;

	for(register int i=2; i<=N; ++i) {

		if(!vis[i])p[++cnt]=i,mu[i]=-1;

		for(register int j=1; j<=cnt&&i*p[j]<=N; ++j) {

			vis[i*p[j]]=1;

			if(i%p[j]==0)break;

			mu[i*p[j]]=-mu[i];

		}

	}

	while(TT--) {

		scanf("%d%d",&n,&mod);

		N=n;Ans=0;

		for(register int i=1; i<=N; ++i) {

			for(register int j=i,k,x; j<=N; j+=i) {

				k=i;if(!mu[k])continue;

				x=qpow(j/k,j);

				T[j]=add(T[j],mul(mu[k],Calc(x,n/j)));

			}

		}

		for(register int i=1; i<=n; ++i)Ans=add(Ans,T[i]),T[i]=0;

		printf("%d\n",Ans);

	}

	return 0;

}

由于这里是$5*10^5$的数据，所以略微卡常，但笔者通过非常不精湛的卡常技术跑到了$3s$以内，所以这里的时间限制我开了$3.2s$.

对等比数列进行精细处理，可以做到$O(n\log^2n)$的复杂度。

#include<bits/stdc++.h>

using namespace std;

#define int long long

const int MAXN=1500000;

int mod,TT;

bitset<MAXN<<1>vis;

int p[MAXN<<1],mu[MAXN<<1],T[MAXN<<1],cnt,n,Ans;

inline int Mod(long long x){

    if(x>=mod)return x%mod;

    return x;

}

inline int add(int x,int y) {

	return Mod(x+y+mod);

}

inline int mul(int x,int y) {

	return Mod(1ll*x*y);

}

inline int qpow(int a,int b) {

	if(!b)return 1;

	if(a<=1||b==1)return a;

	a %= mod;

	int res=1;

	while(b) {

		if(b&1)res=mul(res,a);

		a=mul(a,a);

		b>>=1;

	}

	return res;

}

inline int calc(int x,int y){

	if(y==1)return x;

		int res=calc(x,y/2);

	res=add(res,mul(res,qpow(x,y/2)));

	if(y&1)res=add(res,mul(x,qpow(x,y-1)));

	return res;

}

inline int Calc(int x,int y){int ans=calc(x,y);return mul(ans,ans);}

signed main() {

	scanf("%lld",&TT);

	mu[1]=1;

	int N=MAXN;

	for(int i=2; i<=N; ++i) {

		if(!vis[i])p[++cnt]=i,mu[i]=-1;

		for(int j=1; j<=cnt&&i*p[j]<=N; ++j) {

			vis[i*p[j]]=1;

			if(i%p[j]==0)break;

			mu[i*p[j]]=-mu[i];

		}

	}

	while(TT--) {

		scanf("%lld%lld",&n,&mod);

		N=n;

		Ans=0;

		for(int i=1; i<=N; ++i) {

			for(int j=i; j<=N; j+=i) {

				int k=i;

				int x=qpow(j/k,j);

				if(!mu[k])continue;

				T[j]=add(T[j],mul(mu[k],Calc(x,n/j)));

			}

		}

		for(int i=1; i<=n; ++i)Ans=add(Ans,T[i]),T[i]=0;

		cout<<Ans<<endl;

	}

	return 0;

}

由于常数等原因，这分代码可以拿到$50$分的好成绩。但我们可以通过另一种做法将常数/复杂度降低。

另一种做法

观察：

\[\sum_{d=1}^n\sum_{k=1}^\frac{n}{d}\mu(k)\sum_{i=1}^\frac{n}{kd}\sum_{j=1}^\frac{n}{kd}d^{kd(i+j)}
\]

\[=\sum_{d=1}^n \sum_{k=1}^\frac{n}{d} \mu(k)(d^{kd}+d^{2kd}+...+d^{\frac{n}{kd}*kd=n})^2.
\]

这里同样观察式子发现可以直接算。前一部分是$O(n\ln n)$的$n$倍调和级数的复杂度，后面带上一个$O(\log n)$精细处理的等比数列求求和复杂度。

（代码中的优化即使不加也是可以过的）

#define __AVX__ 1

#define __AVX2__ 1

#define __SSE__ 1

#define __SSE2__ 1

#define __SSE2_MATH__ 1

#define __SSE3__ 1

#define __SSE4_1__ 1

#define __SSE4_2__ 1

#define __SSE_MATH__ 1

#define __SSSE3__ 1

#pragma GCC optimize("Ofast,no-stack-protector,unroll-loops,fast-math")

#pragma GCC target("sse,sse2,sse3,ssse3,sse4.1,sse4.2,avx,avx2,popcnt,tune=native")

#include <immintrin.h>

#include <emmintrin.h>

#include <iostream>

#include <cstdio>

#include <algorithm>

#include <string>

#include <bitset>

using namespace std;

const int MAXN=1.5e6+10;

int mod,T;

bitset<MAXN+1>vis;

int p[MAXN+1],cnt,mu[MAXN+1],N;

inline int Mod(long long a, int pp){

    return a>=pp ? a%pp : a>=0 ? a : a+pp;

}

inline int add(int x,int y){return Mod( (1ll+x+y+mod-1ll),mod);}

inline int mul(int x,int y){return Mod(1ll*x*y,mod);}

void pretreatment(){

	mu[1]=1;

	for(int i=2;i<=MAXN;++i){

		if(!vis[i])p[++cnt]=i,mu[i]=-1;

		for(int j=1;j<=cnt&&i*p[j]<=MAXN;++j){

			vis[i*p[j]]=1;

			if(Mod(i,p[j])==0)break;

			mu[i*p[j]]=-mu[i];

		}

	}

}

inline int qpow(int a,int b){

	if(!b)return 1;

	if(a<=1||b==1)return a;

	int res=1;

	while(b){

		if(b&1)res=mul(res,a);

		a=mul(a,a);b>>=1;

	}

	return res;

}

inline int calc(int x,int y){

	if(y==1)return x;

	int res=calc(x,y>>1);

	res=add(res,mul(res,qpow(x,y>>1)));

	if(y&1)res=add(res,mul(x,qpow(x,y-1)));

	return res;

}

inline int Calc(int x,int y){int ans=calc(x,y);return mul(ans,ans);}

int ssolve(int n,int d){

	int res=0;

	for(register int l=1;l<=n;++l){

		if(!mu[l])continue;

		res=add(res,mul(mu[l],Calc(qpow(d,l),n/l)));

	}

	return res;

}

int solve(int n){

	int ans=0;

	for(register int l=1;l<=n;l++){

		ans=add(ans,ssolve(n/l,qpow(l,l)));

	}

	return ans;

}

signed main(){

	scanf("%lld",&T);

	pretreatment();

	for(;T;T--){

		scanf("%lld%lld",&N,&mod);

		printf("%lld\n",solve(N));

	}

	return 0;

}

可以用整除分块减少循环中乘法的使用，对代码速度可能有一定的提升。

#include<bits/stdc++.h>

using namespace std;

const int MAXN=1.5e6+10;

int mod,T;

bitset<MAXN+1>vis;

int p[MAXN+1],cnt,mu[MAXN+1],N;

inline int Mod(long long a, int pp){return a>=pp ? a%pp : a>=0 ? a : a+pp;}

inline int add(int x,int y){return Mod( (1ll+x+y+mod-1ll),mod);}

inline int mul(int x,int y){return Mod(1ll*x*y,mod);}

inline int qpow(int a,int b){

	if(!b)return 1;

	if(a<=1||b==1)return a;

	a=Mod(a,mod);

	int res=1;

	while(b){

		if(b&1)res=mul(res,a);

		a=mul(a,a);b>>=1;

	}

	return res;

}

inline int calc(int x,int y){

	if(y==1)return x;

	int res=calc(x,y>>1);

	res=add(res,mul(res,qpow(x,y>>1)));

	if(y&1)res=add(res,mul(x,qpow(x,y-1)));

	return res;

}

inline int Calc(int x,int y){int ans=calc(x,y);return mul(ans,ans);}

int ssolve(int n,int d){

	int res=0;

	for(register int l=1,r;l<=n;l=r+1){

		r=(n/(n/l));

		int D=n/l;

		for(int i=l;i<=r;++i){

			if(!mu[i])continue;

			res=add(res,mul(mu[i],Calc(qpow(d,i),D)));

		}

	}

	return res;

}

int solve(int n){

	int ans=0;

	for(register int l=1,r;l<=n;l=r+1){

		r=(n/(n/l));

		int D=n/l;

		for(int i=l;i<=r;++i)ans=add(ans,ssolve(D,qpow(i,i)));

	}

	return ans;

}

int main(){

	scanf("%d",&T);

	mu[1]=1;

	for(register int i=2;i<=MAXN;++i){

		if(!vis[i])p[++cnt]=i,mu[i]=-1;

		for(register int j=1;j<=cnt&&i*p[j]<=MAXN;++j){

			vis[i*p[j]]=1;

			if(Mod(i,p[j])==0)break;

			mu[i*p[j]]=-mu[i];

		}

	}

	for(;T;T--){

		scanf("%d%d",&N,&mod);

		printf("%d\n",solve(N));

	}

	return 0;

}

经由大佬 @C3H5ClO 大佬证明，上面这份代码实际上是$O(n\log n)$的。

这里借用一下 @C3H5ClO 大佬的证明：

\[f(n)=\sum_{d=1}^n\sum_{e=1}^{\lfloor \frac{n}{d} \rfloor}\mu(e)(\sum_{i=1}^{\lfloor \frac{n}{de}\rfloor}d^{de})^2
\]

\[T(n)=O(\sum_{d=1}^n\sum_{e=1}^{\lfloor \frac{n}{d} \rfloor}\log\lfloor \frac{n}{de}\rfloor)
\]

\[T(n)=O(\sum_{i=1}^n\int_0^{\frac{n}{i}}\log\frac{n}{ix}\mathrm{d}x)
\]

\[\int\log\frac{n}{x}\mathrm{d}x=(\log n+1)x-x\log x+C
\]

\[\int_0^n\log\frac{n}{x}\mathrm{d}x=n
\]

\[T(n)=O(\sum_{i=1}^n\frac{n}{i})=O(n\ln n)
\]

（蒟蒻不会微积分惨被教育.jpg）

出这题的本意其实是想看看有没有吊打$\text{std}$的做法的，笔者推了很久并没有找到线性的做法。

【题解】 [EZEC-4]求和的更多相关文章

题解 P1630 【求和】
题目发现题解都不够优雅,就自己来一篇 ( 以下除[代码]处代码,其余均为现场手打,如有误请与本蒟蒻联系 ) [分析] 首先,看清楚了,题目是 $\sum_{i=1}^ai^b$ 的余数 ,而不是 ...
[题解] [CQOI2007] 余数求和
题面题解考虑到这个等式$a\bmod b = a - b * \lfloor\frac{a}{b}\rfloor$ 所以我们可以得到: \[ \begin{aligned} ans & ...
BestCoder Round #86 部分题解
Price List 题意: 有n件商品,每天只能买一件,并且会记录账本,问有多少次一定记多了? 题解: 就是求和,最后如果大于和就输出1,否则0. 代码: #include <bits/std ...
[CSP-S模拟测试96]题解
以后不能再借没改完题的理由不写题解了…… A.求和求$\sum \sum i+j-1$ 柿子就不化了吧……这年头pj都不考这么弱智的公式化简了…… 坑点1:模数不定,可能没有2的逆元,那么只要先把乘 ...
E题 - A+B for Input-Output Practice (IV)
Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Description You ...
【洛谷P1403】约数研究
题目大意:求\[\sum\limits_{i=1}^n\sum\limits_{d|i}1\] 题解:交换求和顺序即可. \[\sum\limits_{i=1}^n\sum\limits_{d|i}1 ...
ACM-ICPC 2018 焦作赛区网络预赛 K题 Transport Ship
There are NN different kinds of transport ships on the port. The i^{th}ith kind of ship can carry th ...
【noip】noip201503求和（题解可能不完美，但绝对详细）
3. 求和难度级别:B: 运行时间限制:1000ms: 运行空间限制:51200KB: 代码长度限制:2000000B 题目描述一条狭长的纸带被均匀划分出了n个格子,格子编号从1到n.每个格子 ...
【题解】P4091 [HEOI2016/TJOI2016]求和
[题解]P4091 [HEOI2016/TJOI2016]求和 [P4091 HEOI2016/TJOI2016]求和可以知道$i,j$从$0$开始是可以的,因为这个时候等于$0$.这种 ...

随机推荐

【Gin-API系列】Gin中间件之鉴权访问（五）
在完成中间件的介绍和日志中间件的代码后,我们的程序已经基本能正常跑通了,但如果要上生产,还少了一些必要的功能,例如鉴权.异常捕捉等.本章我们介绍如何编写鉴权中间件. 鉴权访问,说白了就是给用户的请求增 ...
Android开发之封装log打印日志的工具类，实用logutils详细代码
public final class LogUtil { /** all Log print on-off */ private final static boolean all = true; /* ...
UniRapidJson
https://github.com/takezoh/UniRapidJson 如何编译安卓 cd ~/UniRapidJson/build/android make 生成的so可以在 /Users/ ...
浅谈DOM事件的优化
在 JavaScript 程序的开发中,经常会用到一些频繁触发的 DOM 事件,如 mousemove.resize,还有不是那么常用的鼠标滚轮事件:mousewheel (在 Firefox 中,滚 ...
YOLOv4: Darknet 如何于 Docker 编译，及训练 COCO 子集
YOLO 算法是非常著名的目标检测算法.从其全称 You Only Look Once: Unified, Real-Time Object Detection ,可以看出它的特性: Look Onc ...
5分钟掌握企业LVM磁盘划分
逻辑卷管理LVM是一个多才多艺的硬盘系统工具.无论在Linux或者其他类似的系统,都是非常的好用.传统分区使用固定大小分区,重新调整大小十分麻烦.但是,LVM可以创建和管理“逻辑”卷,而不是直接使用物 ...
纯java代码在控制台运算电话本(不使用数据库)
分享学习 Task_08 package cn.rzpt; import java.util.List; import java.util.Scanner; public class Task_08 ...
python中库引用与import
在蟒蛇绘制函数中,多有turtle. ,称它为<a>.<b>的编码风格库引用扩充python程序功能的方式使用import保留字完成,采用<a>.< ...
hystrix(3) 熔断器
讲完metrics我们就来了解一下熔断器的执行情况,熔断器的判断取决metrics数据. hystrix在执行命令前需要经过熔断器判断,如果服务被熔断,则执行fallback流程,熔断判断逻辑如下: ...
java注解(1)
Java注解是附加在代码中的一些元信息,用于一些工具在编译.运行时进行解析和使用,起到说明.配置的功能.注解不会也不能影响代码的实际逻辑,仅仅起到辅助性的作用.注解是Java SE5中引入的重要的语言 ...

【题解】 [EZEC-4]求和

另一种做法

【题解】 [EZEC-4]求和的更多相关文章

随机推荐

热门专题