smoj2828子数组有主元素
题面
一个数组B,如果有其中一个元素出现的次数大于length(B) div 2,那么该元素就是数组B的主元素,显然数组B最多只有1个主元素,因为数组B有主元素,所以被称为“优美的”。
给出数组A[0..n-1],问数组A有多少个“优美的”子数组。数组A的子数组是由数组A的连续若干个元素构成的数组。数组A不是直接给出的,而是通过如下公式自动产生的:
for i = 0 to n-1 do
{
  A[i] = (seed div 2^16) % m
  seed = (seed * 1103515245 + 12345) % 2^31
}
如上公式中:  n, seed, m都是输入数据给出的,div是表示整数的整除。^是表示幂运算。
输入格式:
一行,3个整数,n,  seed,  m。1 <= n <= 100000。 0 <= seed <= 2^31-1。 1 <= m <= 50。
输出格式
一个整数。
样例
输入样例1
5  200  5
输出样例1
8
输入样例2
10  15  3
输出样例2
23
输入样例3
8  12345678  1
输出样例3
36
输入样例4
27  541  50
输出样例4
27
1s,256MB
思路
由题目可以发现主元素在每一个子数组里只有一个。并且m很小,这说明了生成出的A[i]最大值只有m-1那么大。
m最多只有50,所以我们可以枚举每一个元素作为主元素在A数组中出现了多少次,然后最后累加一下答案就ok了。
那么现在问题来的,如何计算一个元素为主元素在A数组用出现了多少次。
不妨设钦定的主元素是x
我们简单地做一个差分,把a[i]==x的位置都设为1,不然就设为-1,然后做出来一个差分数组。
不如举个例子:
a[i]={0,0,1,2,0}
钦定主元素:x=0
那么做出的差分数组:
      1 1 -1 -1 1
b[i]={1,2,1,0,1}
那么这个差分数组是什么意思呢?不难发现,如果我们要查询区间[1,3]中的主元素是不是x。将b[3]-b[1-1]就得出了1,这个1的意思是区间[1,3]中(x的个数)与(不是x的个数)的差。明显,如果这个差大于0,就说明这个区间是主元素为x的区间。
那么我们知道这个差分数组的特性了,可以思考,我们枚举这个区间的开头i,那么可不可以快速算出有多少B数组的值与b[i-1]的大于0。
这时候就有了一个办法:我们维护一个可以支持查询kth的数据结构,然后每次直接区间查询[i+1,n]大于b[i-1]的数有多少。时间复杂度为O(nmlog(n)),而且特别难写。那么有没有什么办法可以转换成简单一点的呢?
第一层转换
前面说了,我们要查询大于b[i-1]的数有多少,那么我们可以把B数组的值域都记下来,为vis数组,那么上面样例的vis数组为
vis[0]=1;
vis[1]=3;
vis[2]=1;
同时做一个后缀和 sum数组:
sum[0]=5;
sum[1]=4;
sum[2]=1;
不难发现其实我们查询的大于b[i-1]的数有多少就是,sum[b[i-1]+1]。就不需要查询kth了。
但还有个问题,我们查询完sum数组,开头i往下一个跳,区间就少了一个b[i],vis[b[i]]要减1,自然,sum数组从开头到b[i]都要减1。
即当i=2时,vis数组应该是这样的
vis[0]=1;
vis[1]=2;
vis[2]=1;
sum数组应该是这样的
sum[0]=4;
sum[1]=3;
sum[2]=1;
这个问题很好解决,我们可以开一个树状数组来维护,每次查询(b[i-1]+1)的值,然后将1至b[i]都减1。
初始化树状数组tree[i]=sum[i]
时间复杂度:O(nmlog(n)),但代码好些了很多。下面会将第二层优化,时间复杂度将优化成O(nm),是在这个方法的基础上优化的,希望大家先理解这个方法。
代码实现的一些说明:
1、首先,我们写的时候要加上偏移值,因为vis数组下标有可能是负数
2、我实现中的zz的意思是一个指针,指向b[i-1]+1的值,因为我们发现每一次开头i的变化,b[i-1]到b[i]只有可能加1或减1,因为差分数组的特殊性。所以这个(b[i-1]+1)我就用了一个指针来维护。
例如:刚开始b[1-1]为0,zz指向0,a[1]为x,那么b[2-1]就会为1,那么zz就加1,指向1。如果a[2]不为x,那么b[3-1]就会为0,那么zz就减1,指向0。
代码:
#include<bits/stdc++.h>
using namespace std;
#define int long long
#define maxn 400001
const int pyz=100501;
int a[maxn],vis[maxn],b[maxn],sum[maxn],ans,tree[maxn];
int n,SEED,m,Ans;
inline int lowbit(int x)
{return x&-x;}
inline void generate(int n,int SEED,int m){		//生成A数组
	for(int i=1;i<=n;i++){
		a[i]=(SEED/65536ll)%m;
		SEED=(SEED*1103515245ll+12345ll)%2147483648ll;
	}
}
inline void add(int p,int val){
    while(p<maxn){
        tree[p]+=val;
        p+=lowbit(p);
    }
}
inline void add_(int x,int y,int sum){
    add(x,+sum);
    add(y+1,-sum);
}
inline int sum_(int p){
    ans=0;
    while(p!=0){
        ans+=tree[p];
        p-=lowbit(p);
    }
    return ans;
}
inline int solve(int x){
	b[0]=0;long long ans=0,zz=pyz,begin=0,t,sum=0;	//记得要加上偏移值,负数数组存不了
	memset(tree,0,sizeof(tree));
	memset(vis,0,sizeof(vis));
	for(int i=1;i<=n;++i){
		if(a[i]==x)b[i]=b[i-1]+1;	//计算b数组
		else b[i]=b[i-1]-1;
		vis[b[i]+pyz]++;			//计算vis数组
	}
	for(int i=pyz*2;i>=1;--i){
		sum+=vis[i];				//计算sum数组,后缀和
		add_(i,i,sum);				//同时更新树状数组tree数组
	}
	for(int i=1;i<=n;++i){
		t=sum_(zz+1);				//大于所以要加1
		if(a[i]==x)zz++;else zz--;	//更改指针的值
		ans+=t;add_(1,zz,-1);		//更新值
	}
	return ans;
}
signed main(){
	freopen("2828.in","r",stdin);
	freopen("2828.out","w",stdout);
	scanf("%lld%lld%lld",&n,&SEED,&m);
	generate(n,SEED,m);
	for(int i=0;i<m;i++){
		Ans+=solve(i);
	}
	printf("%lld\n",Ans);
	return 0;
}
脸黑,常数大,别人O(nmlog(n))都过了,就我只有73分,不过这也激发了我探究O(nm)复杂度的决心。
第二层优化 时间复杂度O(nm)
辣么,我们现在来讲终究算法,不仅好写,时间复杂度还优。
我们现在来分析树状数组的做法,我们发现每一次指针跳只会一个一个跳,所以实际上树状数组改的很多地方都没有用,可能根本不会查询那里,所以这就导致了时间上的浪费。
既然指针只会一个一个跳,那么我们可以不用树状数组来维护,我们打标记tag,跳到哪,更新到哪。
打tag的方式也很简单,修改自身值的同时,把tag传的下一个去,自身清0。
if(tag[zz]>0)sum[zz]-=tag[zz],tag[zz-1]+=tag[zz],tag[zz]=0;
是不是简单到爆炸!!!
这样通过指针的特殊性,我们把那个log的时间复杂度给省掉了,时间复杂度降为O(nm)。
代码:
#include<bits/stdc++.h>
using namespace std;
#define int long long
#define maxn 200011
const int pyz=100001;
int a[maxn],vis[maxn],b[maxn],sum[maxn],ans,tree[maxn],tag[maxn];
int n,SEED,m,Ans;
inline void generate(int n,int SEED,int m){
	for(int i=1;i<=n;i++){
		a[i]=(SEED/65536ll)%m;
		SEED=(SEED*1103515245ll+12345ll)%2147483648ll;
	}
}
inline int solve(int x){
	b[0]=0;long long ans=0,zz=pyz;
	memset(vis,0,sizeof(vis));memset(tag,0,sizeof(tag));
	for(register int i=1;i<=n;++i){
		if(a[i]==x)b[i]=b[i-1]+1;
		else b[i]=b[i-1]-1;
		vis[b[i]+pyz]++;			//求vis数组
	}
	for(register int i=pyz*2;i>=1;--i)sum[i]=sum[i+1]+vis[i];		//求sum数组
	for(register int i=1;i<=n;++i){
		if(tag[zz]>0)sum[zz]-=tag[zz],tag[zz-1]+=tag[zz],tag[zz]=0;		//打tag
		ans+=sum[zz+1];			//计算答案
		if(a[i]==x)zz++;else zz--;
		sum[zz]--;tag[zz-1]++;	//更新tag,自身值
	}
	return ans;
}
signed main(){
	freopen("2828.in","r",stdin);
	freopen("2828.out","w",stdout);
	scanf("%lld%lld%lld",&n,&SEED,&m);
	generate(n,SEED,m);
	for(int i=0;i<m;++i)Ans+=solve(i);
	printf("%lld\n",Ans);
	return 0;
}
哈哈哈,O(nm)是不是很简单啊。
但
你以为这是极限了吗?
不,事情远远没有你想想那么简单
如果m不是50了怎么办,m是10^9怎么办,会超时哦
第三层扩展性优化,m很大也能做!
时间复杂度O(nsqrt(n))
咳咳,这里只是一个扩展性的做法,针对m很大的做法,当然到这题没有用,不过还是写一下。
首先,第一步,将a[i]离散化,基础步骤
然后,第二步,分类讨论,如果元素出现种数小于sqrt(n),那么就直接跑上面O(nm)的做法,时间复杂度O(nsqrt(n))
接着,第三步,如果种数大于sqrt(n),那么就把出现次数小于sqrt(n)的元素为主元素的数组个数找出来,其实就是对于区间长度为[1,2sqrt(n)]的有主元素的子数组都找出来。但是如果,某个区间的主元素是元素x,这个元素x的总出现次数大于sqrt(n),那么就不加,避免与下面的计算重复。
那么,第四步,剩下的出现次数大于sqrt(n)的元素个数肯定不超过sqrt(n)个,这个简单证明一下就可以了。然后对于这几个元素跑一遍上面说的O(nm),找子数组个数。
最后,第五步,将全部答案加起来。
嗯~,这就是O(n sqrt(n))的做法。
谢谢观赏
smoj2828子数组有主元素的更多相关文章
- 笔试算法题(06):最大连续子数组和 & 二叉树路径和值
		出题:预先输入一个整型数组,数组中有正数也有负数:数组中连续一个或者多个整数组成一个子数组,每个子数组有一个和:求所有子数组中和的最大值,要求时间复杂度O(n): 分析: 时间复杂度为线性表明只允许一 ... 
- Java算法-求最大和的子数组序列
		问题:有一个连续数组,长度是确定的,它包含多个子数组,子数组中的内容必须是原数组内容中的一个连续片段,长度不唯一,子数组中每个元素相加的结果称为子数组的和,现要求找出和最大的一个子数组. 具体算法如下 ... 
- Java实现 LeetCode 795 区间子数组个数 (暴力分析)
		795. 区间子数组个数 给定一个元素都是正整数的数组A ,正整数 L 以及 R (L <= R). 求连续.非空且其中最大元素满足大于等于L 小于等于R的子数组个数. 例如 : 输入: A = ... 
- 给定一个double类型的数组arr,其中的元素可正可负可0,返回子数组累乘的最大乘积。例如arr=[-2.5,4,0,3,0.5,8,-1],子数组[3,0.5,8]累乘可以获得最大的乘积12,所以返回12。
		分析,是一个dp的题目, 设f[i]表示以i为结尾的最大值,g[i]表示以i结尾的最小值,那么 f[i+1] = max{f[i]*arr[i+1], g[i]*arr[i+1],arr[i+1]} ... 
- [LeetCode] Maximum Average Subarray II 子数组的最大平均值之二
		Given an array consisting of n integers, find the contiguous subarray whose length is greater than o ... 
- 连续子数组和的最大值plus
		package wodeshiyao; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStre ... 
- [LeetCode] 907. Sum of Subarray Minimums 子数组最小值之和
		Given an array of integers A, find the sum of min(B), where B ranges over every (contiguous) subarra ... 
- [LeetCode] 644. Maximum Average Subarray II 子数组的最大平均值之二
		Given an array consisting of n integers, find the contiguous subarray whose length is greater than o ... 
- C#LeetCode刷题之#581-最短无序连续子数组( Shortest Unsorted Continuous Subarray)
		问题 给定一个整数数组,你需要寻找一个连续的子数组,如果对这个子数组进行升序排序,那么整个数组都会变为升序排序. 你找到的子数组应是最短的,请输出它的长度. 输入: [2, 6, 4, 8, 10, ... 
随机推荐
- 克隆虚拟机后ip配置
			(1)出错原因: 错误:No suitable device found: no device found for connection "System eth0" 原因:克隆虚拟 ... 
- 未来的flags
			完了大致一扫..... (1)P,NP,NPC,NP-Hard 二分图(2)二分图的判定 Tarjan(3)有向图的Tarjan算法(4)无向图的Tarjan算法 (5)A*算法 环套树(6)环套树的 ... 
- Jekyll+Github个人博客构建之路
			请参考: http://robotkang.cc/2017/03/HowToCreateBlog/ 
- 「ZJOI2008」树的统计
			树剖模板题啊! 这道题的话,最通(jian)俗(dan)易(cu)懂(bao)的解法应该就是树剖了. 加上线段树维护树上路径的最大权值(\(Max\))和路径和(\(sum\)). 至于\(LCT\) ... 
- Fluent_Python_Part2数据结构,03-dict-set,字典和集合
			字典和集合 dict和set都基于hash table实现 1. 大纲: 常见的字典方法 如何处理查找不到的键 标准库中dict类型的变种 set和fronzenset类型 Hash table的工作 ... 
- Plastic Sprayers Manufacturer - The Basic Components Of A Spray Bottle
			From cleaning to personal beauty, many people use spray bottles every day, but few people know how t ... 
- C:编译过程、目标代码文件、 可执行文件和库
			C编程的基本策略是, 用程序把源代码文件转换为可执行文件(其中包含可直接运行的机器语言代码). 典型的C实现通过编译和链接两个步骤来完成这一过程. 编译器把源代码转换成中间代码, 链接器把中间代码和其 ... 
- DOCKER SNAT与DNAT
			映射容器端口到宿主主机的实现 默认情况下,容器可以主动访问到外部网络的连接,但是外部网络无法访问到容器. 容器访问外部实现 容器所有到外部网络的连接,源地址都会被 NAT 成本地系统的 IP 地址.这 ... 
- 使用Vue时localhost:8080中localhost换成ip地址后无法显示页面的问题
			解决办法是:在package.json中 然后重新启动服务器 npm run dev 就正常显示了. 
- 吴裕雄 python 神经网络——TensorFlow pb文件保存方法
			import tensorflow as tf from tensorflow.python.framework import graph_util v1 = tf.Variable(tf.const ... 
