题面

一个数组B，如果有其中一个元素出现的次数大于length(B) div 2，那么该元素就是数组B的主元素，显然数组B最多只有1个主元素,因为数组B有主元素，所以被称为“优美的”。

给出数组A[0..n-1]，问数组A有多少个“优美的”子数组。数组A的子数组是由数组A的连续若干个元素构成的数组。数组A不是直接给出的，而是通过如下公式自动产生的：

for i = 0 to n-1 do

{

  A[i] = (seed div 2^16) % m

  seed = (seed * 1103515245 + 12345) % 2^31

}

如上公式中:  n, seed, m都是输入数据给出的，div是表示整数的整除。^是表示幂运算。

输入格式:

一行，3个整数，n,  seed,  m。1 <= n <= 100000。 0 <= seed <= 2^31-1。 1 <= m <= 50。

输出格式

一个整数。

样例

输入样例1

5  200  5

输出样例1

8

输入样例2

10  15  3

输出样例2

23

输入样例3

8  12345678  1

输出样例3

36

输入样例4

27  541  50

输出样例4

27

1s,256MB

思路

由题目可以发现主元素在每一个子数组里只有一个。并且m很小，这说明了生成出的A[i]最大值只有m-1那么大。

m最多只有50，所以我们可以枚举每一个元素作为主元素在A数组中出现了多少次，然后最后累加一下答案就ok了。

那么现在问题来的，如何计算一个元素为主元素在A数组用出现了多少次。

不妨设钦定的主元素是x

我们简单地做一个差分，把a[i]==x的位置都设为1，不然就设为-1，然后做出来一个差分数组。

不如举个例子：

a[i]={0,0,1,2,0}

钦定主元素：x=0

那么做出的差分数组：

      1 1 -1 -1 1

b[i]={1,2,1,0,1}

那么这个差分数组是什么意思呢？不难发现，如果我们要查询区间[1,3]中的主元素是不是x。将b[3]-b[1-1]就得出了1，这个1的意思是区间[1,3]中（x的个数）与（不是x的个数）的差。明显，如果这个差大于0，就说明这个区间是主元素为x的区间。

那么我们知道这个差分数组的特性了，可以思考，我们枚举这个区间的开头i，那么可不可以快速算出有多少B数组的值与b[i-1]的大于0。

这时候就有了一个办法：我们维护一个可以支持查询kth的数据结构，然后每次直接区间查询[i+1,n]大于b[i-1]的数有多少。时间复杂度为O(nmlog(n))，而且特别难写。那么有没有什么办法可以转换成简单一点的呢？

第一层转换

前面说了，我们要查询大于b[i-1]的数有多少，那么我们可以把B数组的值域都记下来，为vis数组，那么上面样例的vis数组为

vis[0]=1;

vis[1]=3;

vis[2]=1;

同时做一个后缀和 sum数组：

sum[0]=5;

sum[1]=4;

sum[2]=1;

不难发现其实我们查询的大于b[i-1]的数有多少就是，sum[b[i-1]+1]。就不需要查询kth了。

但还有个问题，我们查询完sum数组，开头i往下一个跳，区间就少了一个b[i]，vis[b[i]]要减1，自然，sum数组从开头到b[i]都要减1。

即当i=2时，vis数组应该是这样的

vis[0]=1;

vis[1]=2;

vis[2]=1;

sum数组应该是这样的

sum[0]=4;

sum[1]=3;

sum[2]=1;

这个问题很好解决，我们可以开一个树状数组来维护，每次查询(b[i-1]+1)的值，然后将1至b[i]都减1。

初始化树状数组tree[i]=sum[i]

时间复杂度:O(nmlog(n))，但代码好些了很多。下面会将第二层优化，时间复杂度将优化成O(nm)，是在这个方法的基础上优化的，希望大家先理解这个方法。

代码实现的一些说明：

1、首先，我们写的时候要加上偏移值，因为vis数组下标有可能是负数

2、我实现中的zz的意思是一个指针，指向b[i-1]+1的值，因为我们发现每一次开头i的变化，b[i-1]到b[i]只有可能加1或减1，因为差分数组的特殊性。所以这个(b[i-1]+1)我就用了一个指针来维护。

例如：刚开始b[1-1]为0，zz指向0，a[1]为x，那么b[2-1]就会为1，那么zz就加1，指向1。如果a[2]不为x，那么b[3-1]就会为0，那么zz就减1，指向0。

代码：

#include<bits/stdc++.h>

using namespace std;

#define int long long

#define maxn 400001

const int pyz=100501;

int a[maxn],vis[maxn],b[maxn],sum[maxn],ans,tree[maxn];

int n,SEED,m,Ans;

inline int lowbit(int x)

{return x&-x;}

inline void generate(int n,int SEED,int m){		//生成A数组

	for(int i=1;i<=n;i++){

		a[i]=(SEED/65536ll)%m;

		SEED=(SEED*1103515245ll+12345ll)%2147483648ll;

	}

}

inline void add(int p,int val){

    while(p<maxn){

        tree[p]+=val;

        p+=lowbit(p);

    }

}

inline void add_(int x,int y,int sum){

    add(x,+sum);

    add(y+1,-sum);

}

inline int sum_(int p){

    ans=0;

    while(p!=0){

        ans+=tree[p];

        p-=lowbit(p);

    }

    return ans;

}

inline int solve(int x){

	b[0]=0;long long ans=0,zz=pyz,begin=0,t,sum=0;	//记得要加上偏移值，负数数组存不了

	memset(tree,0,sizeof(tree));

	memset(vis,0,sizeof(vis));

	for(int i=1;i<=n;++i){

		if(a[i]==x)b[i]=b[i-1]+1;	//计算b数组

		else b[i]=b[i-1]-1;

		vis[b[i]+pyz]++;			//计算vis数组

	}

	for(int i=pyz*2;i>=1;--i){

		sum+=vis[i];				//计算sum数组，后缀和

		add_(i,i,sum);				//同时更新树状数组tree数组

	}

	for(int i=1;i<=n;++i){

		t=sum_(zz+1);				//大于所以要加1

		if(a[i]==x)zz++;else zz--;	//更改指针的值

		ans+=t;add_(1,zz,-1);		//更新值

	}

	return ans;

}

signed main(){

	freopen("2828.in","r",stdin);

	freopen("2828.out","w",stdout);

	scanf("%lld%lld%lld",&n,&SEED,&m);

	generate(n,SEED,m);

	for(int i=0;i<m;i++){

		Ans+=solve(i);

	}

	printf("%lld\n",Ans);

	return 0;

}

脸黑，常数大，别人O(nmlog(n))都过了，就我只有73分，不过这也激发了我探究O(nm)复杂度的决心。

第二层优化时间复杂度O(nm)

辣么，我们现在来讲终究算法，不仅好写，时间复杂度还优。

我们现在来分析树状数组的做法，我们发现每一次指针跳只会一个一个跳，所以实际上树状数组改的很多地方都没有用，可能根本不会查询那里，所以这就导致了时间上的浪费。

既然指针只会一个一个跳，那么我们可以不用树状数组来维护，我们打标记tag，跳到哪，更新到哪。

打tag的方式也很简单，修改自身值的同时，把tag传的下一个去，自身清0。

if(tag[zz]>0)sum[zz]-=tag[zz],tag[zz-1]+=tag[zz],tag[zz]=0;

是不是简单到爆炸！！！

这样通过指针的特殊性，我们把那个log的时间复杂度给省掉了，时间复杂度降为O(nm)。

代码：

#include<bits/stdc++.h>

using namespace std;

#define int long long

#define maxn 200011

const int pyz=100001;

int a[maxn],vis[maxn],b[maxn],sum[maxn],ans,tree[maxn],tag[maxn];

int n,SEED,m,Ans;

inline void generate(int n,int SEED,int m){

	for(int i=1;i<=n;i++){

		a[i]=(SEED/65536ll)%m;

		SEED=(SEED*1103515245ll+12345ll)%2147483648ll;

	}

}

inline int solve(int x){

	b[0]=0;long long ans=0,zz=pyz;

	memset(vis,0,sizeof(vis));memset(tag,0,sizeof(tag));

	for(register int i=1;i<=n;++i){

		if(a[i]==x)b[i]=b[i-1]+1;

		else b[i]=b[i-1]-1;

		vis[b[i]+pyz]++;			//求vis数组

	}

	for(register int i=pyz*2;i>=1;--i)sum[i]=sum[i+1]+vis[i];		//求sum数组

	for(register int i=1;i<=n;++i){

		if(tag[zz]>0)sum[zz]-=tag[zz],tag[zz-1]+=tag[zz],tag[zz]=0;		//打tag

		ans+=sum[zz+1];			//计算答案

		if(a[i]==x)zz++;else zz--;

		sum[zz]--;tag[zz-1]++;	//更新tag，自身值

	}

	return ans;

}

signed main(){

	freopen("2828.in","r",stdin);

	freopen("2828.out","w",stdout);

	scanf("%lld%lld%lld",&n,&SEED,&m);

	generate(n,SEED,m);

	for(int i=0;i<m;++i)Ans+=solve(i);

	printf("%lld\n",Ans);

	return 0;

}

哈哈哈，O(nm)是不是很简单啊。

但

你以为这是极限了吗？

不，事情远远没有你想想那么简单

如果m不是50了怎么办，m是10^9怎么办，会超时哦

第三层扩展性优化，m很大也能做！

时间复杂度O(nsqrt(n))

咳咳，这里只是一个扩展性的做法，针对m很大的做法，当然到这题没有用，不过还是写一下。

首先，第一步，将a[i]离散化，基础步骤

然后，第二步，分类讨论，如果元素出现种数小于sqrt(n)，那么就直接跑上面O(nm)的做法，时间复杂度O(nsqrt(n))

接着，第三步，如果种数大于sqrt(n)，那么就把出现次数小于sqrt(n)的元素为主元素的数组个数找出来，其实就是对于区间长度为[1,2sqrt(n)]的有主元素的子数组都找出来。但是如果，某个区间的主元素是元素x，这个元素x的总出现次数大于sqrt(n)，那么就不加，避免与下面的计算重复。

那么，第四步，剩下的出现次数大于sqrt(n)的元素个数肯定不超过sqrt(n)个，这个简单证明一下就可以了。然后对于这几个元素跑一遍上面说的O(nm)，找子数组个数。

最后，第五步，将全部答案加起来。

嗯~，这就是O(n sqrt(n))的做法。

谢谢观赏

smoj2828子数组有主元素的更多相关文章

笔试算法题（06）：最大连续子数组和 & 二叉树路径和值
出题:预先输入一个整型数组,数组中有正数也有负数:数组中连续一个或者多个整数组成一个子数组,每个子数组有一个和:求所有子数组中和的最大值,要求时间复杂度O(n): 分析: 时间复杂度为线性表明只允许一 ...
Java算法-求最大和的子数组序列
问题:有一个连续数组,长度是确定的,它包含多个子数组,子数组中的内容必须是原数组内容中的一个连续片段,长度不唯一,子数组中每个元素相加的结果称为子数组的和,现要求找出和最大的一个子数组. 具体算法如下 ...
Java实现 LeetCode 795 区间子数组个数（暴力分析）
795. 区间子数组个数给定一个元素都是正整数的数组A ,正整数 L 以及 R (L <= R). 求连续.非空且其中最大元素满足大于等于L 小于等于R的子数组个数. 例如 : 输入: A = ...
给定一个double类型的数组arr，其中的元素可正可负可0，返回子数组累乘的最大乘积。例如arr=[-2.5，4，0，3，0.5，8，-1]，子数组[3，0.5，8]累乘可以获得最大的乘积12，所以返回12。
分析,是一个dp的题目, 设f[i]表示以i为结尾的最大值,g[i]表示以i结尾的最小值,那么 f[i+1] = max{f[i]*arr[i+1], g[i]*arr[i+1],arr[i+1]} ...
[LeetCode] Maximum Average Subarray II 子数组的最大平均值之二
Given an array consisting of n integers, find the contiguous subarray whose length is greater than o ...
连续子数组和的最大值plus
package wodeshiyao; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStre ...
[LeetCode] 907. Sum of Subarray Minimums 子数组最小值之和
Given an array of integers A, find the sum of min(B), where B ranges over every (contiguous) subarra ...
[LeetCode] 644. Maximum Average Subarray II 子数组的最大平均值之二
Given an array consisting of n integers, find the contiguous subarray whose length is greater than o ...
C#LeetCode刷题之#581-最短无序连续子数组（ Shortest Unsorted Continuous Subarray）
问题给定一个整数数组,你需要寻找一个连续的子数组,如果对这个子数组进行升序排序,那么整个数组都会变为升序排序. 你找到的子数组应是最短的,请输出它的长度. 输入: [2, 6, 4, 8, 10, ...

随机推荐

Arrays.asList() 踩坑
该方法是将数组转化为list,但转换后的list集合,不支持add 和 remove 代码如下: 阅读相关: 本类演示了Arrays类中的asList方法 (1) 该方法对于基本数据类型的数组支持 ...
P1028
一开始没看懂题,看了题解才明白的 = =.思路是,先找规律,会发现有重合部分,利用这些重合部分,写出递推公式. num = 0 时,只有 1 种组合: num = 1 时,只有 1 种组合: num ...
理解Linux内核注释
内核是Linux的心脏,它是在引导时装入的程序,用来提供用户层程序和硬件之间的接口,执行发生在多任务系统中的实际任务转换,处理读写磁盘的需求,处理网络接口,以及管理内存.一般情况下,自动安装的内核无需 ...
WordPress 网站迁移
最近想把本地的WordPress迁移到我的Linux虚拟机里面,是不是很无聊,哈哈哈,接下来就是一过程了,其实这个和迁移到线上是一样的, 1.首先将本地的文件WordPress通过FTP传到虚拟机上: ...
Python学习第二十八课——Django(urls)
Django框架中的urls配置: 首先通过pycharm创建一个Django项目: 例如要写blog的功能:则在digango_lesson中的urls代码如下: """ ...
【Hibernate 多对多】
HibernateManytoMany public class HibernateManytoMany { //演示维护第三张表 @Test public void testTable2() { S ...
MariaDB-Galera部署
Galera Cluster:集成了Galera插件的MySQL集群,是一种新型的,数据不共享的,高度冗余的高可用方案,目前Galera Cluster有两个版本,分别是Percona Xtradb ...
preg_replace相关问题
preg_replace preg_replace 函数执行一个正则表达式的搜索和替换. 语法: preg_replace ( mixed $pattern , mixed $replacement ...
unittest中的parameterized参数化
一.安装插件 pip install parameterized 二.有默认参数情况与没有默认参数情况---1 注意:这种写法,只能给单个用例进行参数化,不能给多个用例使用,要每个用例都进行参数化. ...
SSH整合hibernate无法正常自动生成表
检查持久化类的属性和映射文件是否正确配置,比如date格式的属性最容易配置错误

smoj2828子数组有主元素

题面

样例

思路