BZOJ 4566 JZYZOJ 1547 [haoi2016T5]找相同子串 后缀数组 并查集
http://172.20.6.3/Problem_Show.asp?id=1547
http://www.lydsy.com/JudgeOnline/problem.php?id=4566
单纯后缀数组是O(n^2)应该是40分
似乎后缀自动机是正解。
但是后缀数组+并查集也可以乱搞a掉,这里写的是并查集写法,也算是get了一个并查集的用法,某种意义上并查集可以用来维护区间最大值最小值的贡献,实现方法见代码。
定义字符串大小的整型变量时候,
char siz;
导致re什么的,
我大概是个zz。
顺便存个板子,抄紫萱学姐的板子。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
const int maxn=;
const int pl=;
int sa[maxn*+pl]={};//排名第i的是从sa[i]开始的数组
int rk[maxn*+pl]={};//i的排名
int height[maxn*+pl]={};//排名第i的与排名第i-1的最长相同前缀长度
int temp[maxn*+pl]={};//暂时的排名
int cnt[maxn*+pl]={};//第i种(字典序)前缀的有多少个(的前缀和)
int p[maxn*+pl]={};//临时对这一次需要用的sa的储存,处理了后缀长度不同的情况。
char ch[maxn*+pl]={},ch1[maxn]={},ch2[maxn]={};
int siz1,siz2,siz;
int fa[maxn*+pl]={},a[maxn*+pl]={},lef[maxn*+pl]={},rig[maxn*+pl]={};
inline bool equ(int x,int y,int l){return rk[x]==rk[y]&&rk[x+l]==rk[y+l];}
void SA(){
for(int i=;i<=siz;i++)rk[i]=ch[i],sa[i]=i;
for(int i,sig=,l=,pos=;pos<siz;sig=pos){//l从0开始是预处理
pos=;
for(i=siz-l+;i<=siz;i++)p[++pos]=i;
for(i=;i<=siz;i++)if(sa[i]>l)p[++pos]=sa[i]-l;
for(i=;i<=sig;i++)cnt[i]=;
for(i=;i<=siz;i++)cnt[rk[p[i]]]++;
for(i=;i<=sig;i++)cnt[i]+=cnt[i-];
for(i=siz;i>;i--){sa[cnt[rk[p[i]]]]=p[i];cnt[rk[p[i]]]--;}
pos=;
for(i=;i<=siz;i++){
if(equ(sa[i],sa[i-],l))temp[sa[i]]=pos ;
else temp[sa[i]]=++pos;
}for(i=;i<=siz;i++)rk[i]=temp[i];
if(l==)l=;
else l<<=;
}
for(int i=,k=;i<=siz;i++){
/*对于每一个位置的后缀,下一个位置的后缀可匹配的最短长度
一定大于等于该位置可匹配的长度-1,显然。所以是O(n)的算法
*/
if(rk[i]==){k=;continue;}
if(k>)k--;
int j=sa[rk[i]-];
while(ch[i+k]==ch[j+k])k++;
height[rk[i]]=k;
}
}
bool mcmp(int x,int y){return height[x]>height[y];}
int getfa(int x){
if(x!=fa[x])fa[x]=getfa(fa[x]);
return fa[x];
}
int main(){
//freopen("a.in","r",stdin);
scanf("%s",&ch1);siz1=strlen(ch1);
scanf("%s",&ch2);siz2=strlen(ch2);
ch[siz1+]='z'+;siz=siz1+siz2+;
for(int i=;i<siz1;i++)ch[i+]=ch1[i];
for(int i=;i<siz2;i++)ch[siz1++i]=ch2[i];
SA();
for(int i=;i<=siz;i++){
a[i]=fa[i]=i;
lef[i]=(sa[i]<=siz1);
rig[i]=^lef[i];
}sort(a+,a++siz,mcmp);
long long ans=;
int x,y;
for(int i=;i<=siz;i++){
if(a[i]==)continue;
x=getfa(a[i]);y=getfa(a[i]-);
ans+=(long long)height[a[i]]*(long long)(lef[x]*rig[y]+rig[x]*lef[y]);
lef[x]+=lef[y];rig[x]+=rig[y];fa[y]=x;
}printf("%lld\n",ans);
return ;
}
更新:http://www.cnblogs.com/137shoebills/p/8511439.html 这是一道板子题的代码,注释应该被我完善了,更加清晰一点,所以我为什么要先写一道组合题再写板子啊喂。
BZOJ 4566 JZYZOJ 1547 [haoi2016T5]找相同子串 后缀数组 并查集的更多相关文章
- BZOJ 4199: [Noi2015]品酒大会( 后缀数组 + 并查集 )
求出后缀数组后, 对height排序, 从大到小来处理(r相似必定是0~r-1相似), 并查集维护. 复杂度O(NlogN + Nalpha(N)) ------------------------- ...
- BZOJ 4199 [Noi2015]品酒大会:后缀数组 + 并查集
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=4199 题意: 给你一个长度为n的字符串s,和一个长为n的数组v. 对于每个整数r∈[0,n ...
- URAL 1297 最长回文子串(后缀数组)
1297. Palindrome Time limit: 1.0 secondMemory limit: 64 MB The “U.S. Robots” HQ has just received a ...
- poj 2774 最长公共子串 后缀数组
Long Long Message Time Limit: 4000MS Memory Limit: 131072K Total Submissions: 25752 Accepted: 10 ...
- poj 1743 Musical Theme(最长重复子串 后缀数组)
poj 1743 Musical Theme(最长重复子串 后缀数组) 有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复 ...
- BZOJ 3230 相似子串 | 后缀数组 二分 ST表
BZOJ 3230 相似子串 题面 题解 首先我们要知道询问的两个子串的位置. 先正常跑一遍后缀数组并求出height数组. 对于每一个后缀suffix(i),考虑以i开头的子串有多少是之前没有出现过 ...
- bzoj 3230 相似子串——后缀数组
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3230 作出后缀数组,从 LCP 看每个位置对于本质不同子串的贡献,而且他们已经按前面部分排好 ...
- BZOJ 1396: 识别子串( 后缀数组 + 线段树 )
这道题各位大神好像都是用后缀自动机做的?.....蒟蒻就秀秀智商写一写后缀数组解法..... 求出Height数组后, 我们枚举每一位当做子串的开头. 如上图(x, y是height值), Heigh ...
- BZOJ 3230: 相似子串(后缀数组)
传送门 解题思路 其实题目挺好想的.首先子串排名可以由后缀数组求得,因为不算重复的,所以后缀数组的每个后缀排名的去掉\(lcp\)的前缀排名为当前后缀的子串排名.这样就可以预处理出每个后缀的\(l,r ...
随机推荐
- Java多线程学习(七)并发编程中一些问题
本节思维导图: 关注微信公众号:"Java面试通关手册" 回复"Java多线程"获取思维导图源文件和思维导图软件. 多线程就一定好吗?快吗?? 并发编程的目的就 ...
- java线上应用故障排查之二:高内存占用【转】
前一篇介绍了线上应用故障排查之一:高CPU占用,这篇主要分析高内存占用故障的排查. 搞Java开发的,经常会碰到下面两种异常: 1.java.lang.OutOfMemoryError: PermGe ...
- https、socket、http协议
一.https https 其实是由两部分组成:http+ssl(Secure Sockets Layer 安全套接层)/tls(Transport Layer Security 继任者安全传输层), ...
- Spring Cloud Feign 输出日志
还需要在application 文件中配置: #feign调用日志输出logging.level.cn.XXX=DEBUG Logger.Level下面有几种级别. BASIC : 只输出 请求URL ...
- word2vec原理
最原始的是NNLM,然后对其改进,有了后面的层次softmax和skip gram 层次softmax:去掉了隐藏层,后面加了huffuman树,concat的映射层也变成了sum skip gram ...
- hosts,命令行前面的显示
1,/etc/hosts,主机名ip配置文件. # Do not remove the following line, or various programs # that require netwo ...
- 主机名/etc/hosts文件的作用
1,/etc/hosts,主机名ip配置文件. # Do not remove the following line, or various programs # that require netwo ...
- 后门技术和Linux LKM Rootkit详解
2010-01-15 10:32 chinaitlab chinaitlab 字号:T | T 在这篇文章里, 我们将看到各种不同的后门技术,特别是 Linux的可装载内核模块(LKM). 我们将会发 ...
- MVC开发模式与javaEE三层架构
1.MVC开发模式 1. M:Model,模型.JavaBean * 完成具体的业务操作,如:查询数据库,封装对象2. V:View,视图.JSP * 展示数据3. C:C ...
- BeanUtils简化数据封装
BeanUtils主要用来封装JavaBean的. 1.什么是JavaBean JavaBean指的是标准的类. 要求: 1. 类必须被public修饰2. 必须提供空参的构造器3. 成员变量必须使用 ...