题意

在 \(S\) 中找出 \(t\) 个子串满足 \(t_{i+1}\) 是 \(t_{i}\) 的子串,要让 \(t\) 最大。

\(|S| \leq 5\times 10^5\).

分析

  • 定义状态 \(f_{i}\) 表示从 \(i\) 出发能够得到的最长的 \(journey\) .

  • 容易得到最终的答案最右边的串长度一定可以是1.

  • 同时如果删掉没用的部分过后 \(t_i\) 的长度一定可以为 $t_{i+1} +1 $.

  • 如果在 \(i\) 位置存在长度为 \(k\) 的答案的话,将两边某一个字符在所有串中抠掉(还要舍去一个串),一定也存在长度为 \(k-1\) 的答案,所以答案单调。

  • 假设当前枚举的答案为 \(k\) ,只需要在 \([i+k,n]\) 这个区间中存在一个子串满足

\[S_{i,i+1\cdots i+k-2}=S_{j,j+1\cdots j+k-2}$$ 或者 $$S_{i+1,i+2\cdots i+k-1}=S_{j,j+1\cdots j+k-2}
\]

同时 \(f_j\geq k-1\) 的话,就说明 \(f_i\geq k\) .

  • 但是发现一定有 \(f_i\leq f_{i+1}+1\) ,所以暴力枚举每个位置的答案,不需要二分。

  • 那些满足 \(LCP(i,j) \geq k-1\) 的位置在 \(sa\) 数组中一定是一个区间,线段树维护最大值。

  • 总时间复杂度为 \(O(nlogn)\)。

代码

#include<bits/stdc++.h>
using namespace std;
#define go(u) for(int i=head[u],v=e[i].to;i;i=e[i].lst,v=e[i].to)
#define rep(i,a,b) for(int i=a;i<=b;++i)
#define repd(i,a,b) for(int i=a;i>=b;--i)
#define pb push_back
typedef long long LL;
inline int gi(){
int x=0,f=1;char ch=getchar();
while(!isdigit(ch)) {if(ch=='-') f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-48;ch=getchar();}
return x*f;
}
template<typename T>inline bool Max(T &a,T b){return a<b?a=b,1:0;}
template<typename T>inline bool Min(T &a,T b){return b<a?a=b,1:0;}
const int N=5e5 + 7;
int n,ans;
char s[N];
int val[N<<2],f[N];
#define Ls o<<1
#define Rs o<<1|1
void modify(int p,int l,int r,int o,int v){
Max(val[o],v);
if(l==r) return;
int mid=l+r>>1;
if(p<=mid) modify(p,l,mid,Ls,v);
else modify(p,mid+1,r,Rs,v);
}
int query(int L,int R,int l,int r,int o){
if(L<=l&&r<=R) return val[o];
int mid=l+r>>1;
if(R<=mid) return query(L,R,l,mid,Ls);
if(L>mid) return query(L,R,mid+1,r,Rs);
return max(query(L,R,l,mid,Ls),query(L,R,mid+1,r,Rs));
}
namespace SA{
int x[N],y[N],c[N],sa[N],h[N],mi[N][20],Log[N];
void getsa(int m){
rep(i,1,m) c[i]=0;
rep(i,1,n) c[x[i]=s[i]]++;
rep(i,1,m) c[i]+=c[i-1];
repd(i,n,1) sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1){
int p=0;
for(int i=n;i>=n-k+1;--i) y[++p]=i;
rep(i,1,n) if(sa[i]>k) y[++p]=sa[i]-k;
rep(i,1,m) c[i]=0;
rep(i,1,n) c[x[y[i]]]++;
rep(i,1,m) c[i]+=c[i-1];
repd(i,n,1) sa[c[x[y[i]]]--]=y[i];
swap(x,y);p=1;x[sa[1]]=1;
rep(i,2,n)
x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p:++p;
if(p>=n) break; m = p;
}
rep(i,1,n) x[sa[i]]=i;
for(int i=1,j=0;i<=n;++i){
if(j) --j;if(x[i]==1) continue;
while(s[i+j]==s[sa[x[i]-1]+j]) ++j;
h[x[i]]=j;
}
Log[1]=0;
rep(i,2,n) Log[i]=Log[i>>1]+1;
rep(i,1,n) mi[i][0]=h[i];
for(int k=1;1<<k<=n;++k)
for(int i=1;i+(1<<k)-1<=n;++i)
mi[i][k]=min(mi[i][k-1],mi[i+(1<<k-1)][k-1]);
}
int rmq_query(int l,int r){
l++;
if(l>r) return n+1;
int k=Log[r-l+1];
return min(mi[l][k],mi[r-(1<<k)+1][k]);
}
int get1(int p,int up){
int l=1,r=p;
while(l<r){
int mid=l+r>>1;
if(rmq_query(mid,p)>=up) r=mid;
else l=mid+1;
}
return l;
}
int get2(int p,int up){
int l=p,r=n;
while(l<r){
int mid=l+r+1>>1;
if(rmq_query(p,mid)>=up) l=mid;
else r=mid-1;
}
return l;
}
}
int main(){
scanf("%d%s",&n,s+1);
using namespace SA;
getsa(129);
f[n]=ans=1;
for(int i=n-1,j=1;i;--i){
for(++j;j;--j){
if(i+j<=n) modify(x[i+j],1,n,1,f[i+j]);
int l=get1(x[i+1],j-1),r=get2(x[i+1],j-1),fg=0;
fg|=query(l,r,1,n,1)>=j-1;
l=get1(x[i],j-1),r=get2(x[i],j-1);
fg|=query(l,r,1,n,1)>=j-1;
if(fg) break;
}
f[i]=j;
Max(ans,f[i]);
}
printf("%d\n",ans);
return 0;
}

[CF1063F]String Journey[后缀数组+线段树]的更多相关文章

  1. Codeforces 1063F - String Journey(后缀数组+线段树+dp)

    Codeforces 题面传送门 & 洛谷题面传送门 神仙题,做了我整整 2.5h,写篇题解纪念下逝去的中午 后排膜拜 1 年前就独立切掉此题的 ymx,我在 2021 年的第 5270 个小 ...

  2. BZOJ 1396: 识别子串( 后缀数组 + 线段树 )

    这道题各位大神好像都是用后缀自动机做的?.....蒟蒻就秀秀智商写一写后缀数组解法..... 求出Height数组后, 我们枚举每一位当做子串的开头. 如上图(x, y是height值), Heigh ...

  3. 【XSY1551】往事 广义后缀数组 线段树合并

    题目大意 给你一颗trie树,令\(s_i\)为点\(i\)到根的路径上的字符组成的字符串.求\(max_{u\neq v}(LCP(s_u,s_v)+LCS(s_u,s_v))\) \(LCP=\) ...

  4. Luogu4770 NOI2018你的名字(后缀数组+线段树)

    即求b串有多少个本质不同的非空子串,在a串的给定区间内未出现.即使已经8102年并且马上就9102年了,还是要高举SA伟大旗帜不动摇. 考虑离线,将所有询问串及一开始给的串加分隔符连起来,求出SA.对 ...

  5. BZOJ 2865 字符串识别 | 后缀数组 线段树

    集训讲字符串的时候我唯一想出正解的题-- 链接 BZOJ 2865 题面 给出一个长度为n (n <= 5e5) 的字符串,对于每一位,求包含该位的.最短的.在原串中只出现过一次的子串. 题解 ...

  6. bzoj 1396: 识别子串 && bzoj 2865: 字符串识别【后缀数组+线段树】

    根据height数组的定义,和当前后缀串i最长的相同串的长度就是max(height[i],height[i+1]),这个后缀贡献的最短不同串长度就是len=max(height[i],height[ ...

  7. BZOJ 2865 字符串识别(后缀数组+线段树)

    很容易想到只考虑后缀长度必须为\(max(height[rk[i]],height[rk[i]+1])+1\)(即\([i,i+x-1]\)代表的串只出现过一次)然后我正着做一遍反着做一遍,再取一个\ ...

  8. [CF653F] Paper task - 后缀数组,线段树,vector

    [CF653F] Paper task Description 给定一个括号序列,统计合法的本质不同子串的个数. Solution 很容易想到,只要在传统统计本质不同子串的基础上修改一下即可. 考虑经 ...

  9. BZOJ.1396.识别子串(后缀自动机/后缀数组 线段树)

    题目链接 SAM:能成为识别子串的只有那些|right|=1的节点代表的串. 设这个节点对应原串的右端点为r[i],则如果|right[i]|=1,即\(s[\ [r_i-len_i+1,r_i-le ...

随机推荐

  1. SQLSERVER将数据移到另一个文件组之后清空文件组并删除文件组

    SQLSERVER将数据移到另一个文件组之后清空文件组并删除文件组 之前写过一篇文章:SQLSERVER将一个文件组的数据移动到另一个文件组 每个物理文件(数据文件)对应一个文件组的情况(一对一) 如 ...

  2. 【SPL标准库专题(1)】 SPL简介

    什么是SPL SPL是Standard PHP Library(PHP标准库)的缩写. 根据官方定义,它是"a collection of interfaces and classes th ...

  3. Oracle EBS FTP显示无法与某IP 连接

    首先 用root用户登录 如果可以登录 那么应该是权限的问题 这里选择 方法二:修改 /etc/sudoers 文件,找到下面一行,在root下面添加一行,如下所示: ## Allow root to ...

  4. Oracle EBS OPM 取消生产批

    --取消生产批 --created by jenrry SET serveroutput on; DECLARE p_batch_header_rec gme_batch_header%ROWTYPE ...

  5. 三种方法实现java调用Restful接口

    1,基本介绍 Restful接口的调用,前端一般使用ajax调用,后端可以使用的方法比较多, 本次介绍三种: 1.HttpURLConnection实现 2.HttpClient实现 3.Spring ...

  6. cdn刷新和对应的浏览器现象

    1.浏览器手动点刷新,会发起网络请求,从cdn判断last-modify时间是否一致,未过期则返回304,如果已经过期则返回200,重新请求 关键在于发起的网络请求中'If-Modified-Sinc ...

  7. C# System.IO.Path

    Path的常用方法 函数列表 对一个路径做相应操作,包括文件路径,目录路径,通常会用到Path这个类, 本文列举一些常用的操作. 获取指定路径字符串的目录信息 public static string ...

  8. pip 设置国内源

    最近使用 pip 安装包,动辄十几 k 甚至几 k 的下载速度,确实让人安装的时候心情十分不好.所以还是要给 pip 换一个国内的源.可以显著的提升安装速度.有更多的时间来研究算法. 下面,列一下收集 ...

  9. 【转】Redis学习---NoSQL和SQL的区别及使用场景

    什么是NoSQL NoSQL,指的是非关系型的数据库.NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称,它具有非关系型.分布式.不提供ACID的数 ...

  10. 【转】Java十大常用框架介绍(spring系+dubbo+RabbitMQ+Ehcache+redis)

    一.SpringMVC Spring Web MVC是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进行职责解耦,基于请求驱动 ...