很容易想到只考虑后缀长度必须为\(max(height[rk[i]],height[rk[i]+1])+1\)(即\([i,i+x-1]\)代表的串只出现过一次)然后我正着做一遍反着做一遍,再取一个\(min\)最后挂了。。。

设\(x=max(height[rk[i]],height[rk[i]+1])+1\)我们考虑\(i\)的贡献,会给区间\([i,i+x-1]\)一个贡献x

,设\(r=i+x-1\)然后会给r+1一个贡献x+1就是(r+1)-i+1,接着是r+2的贡献(r+2)-i+1。。。

最后我们对每一个点求出这个点的最小的贡献。这堆东西可以用线段树维护。

值得注意的一点是当i+x-1>n时并不能产生贡献,因为此时已经到了字符串末尾。

我们无法加上\(max(height[rk[i]],height[rk[i]+1])+1\)最后的那个1。

#include<iostream>
#include<cstring>
#include<cmath>
#include<cstdio>
#include<algorithm>
using namespace std;
#define mid ((l+r)>>1)
#define ls now<<1
#define rs now<<1|1
const int N=501000;
int c[N],x[N],y[N],sa[N],rk[N],height[N],n,m;
int lazy1[N*5],lazy2[N*5],mn[N*5];
char s[N];
void get_sa(){
for(int i=1;i<=n;i++)c[x[i]=s[i]]++;
for(int i=1;i<=m;i++)c[i]+=c[i-1];
for(int i=n;i>=1;i--)sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1){
int num=0;
for(int i=n-k+1;i<=n;i++)y[++num]=i;
for(int i=1;i<=n;i++)if(sa[i]>k)y[++num]=sa[i]-k;
for(int i=1;i<=m;i++)c[i]=0;
for(int i=1;i<=n;i++)c[x[i]]++;
for(int i=1;i<=m;i++)c[i]+=c[i-1];
for(int i=n;i>=1;i--)sa[c[x[y[i]]]--]=y[i],y[i]=0;
for(int i=1;i<=n;i++)swap(x[i],y[i]);
x[sa[1]]=1;num=1;
for(int i=2;i<=n;i++)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
if(n==num)break;
m=num;
}
}
void get_height(){
int k=0;
for(int i=1;i<=n;i++)rk[sa[i]]=i;
for(int i=1;i<=n;i++){
if(rk[i]==1)continue;
if(k)k--;
int j=sa[rk[i]-1];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k])k++;
height[rk[i]]=k;
}
}
void build(int l,int r,int now){
if(l==r){mn[now]=n;return;}
build(l,mid,ls);
build(mid+1,r,rs);
}
void update(int now){
mn[now]=min(mn[ls],mn[rs]);
}
void pushdown(int l,int r,int now){
if(l==r)return;
if(lazy1[now]){
mn[ls]=min(mn[ls],lazy1[now]);
mn[rs]=min(mn[rs],lazy1[now]);
if(lazy1[rs])lazy1[rs]=min(lazy1[rs],lazy1[now]);
else lazy1[rs]=lazy1[now];
if(lazy1[ls])lazy1[ls]=min(lazy1[ls],lazy1[now]);
else lazy1[ls]=lazy1[now];
lazy1[now]=0;
}
if(lazy2[now]){
mn[ls]=min(mn[ls],l+lazy2[now]);
mn[rs]=min(mn[rs],mid+1+lazy2[now]);
if(lazy2[rs])lazy2[rs]=min(lazy2[rs],lazy2[now]);
else lazy2[rs]=lazy2[now];
if(lazy2[ls])lazy2[ls]=min(lazy2[ls],lazy2[now]);
else lazy2[ls]=lazy2[now];
lazy2[now]=0;
}
}
void add1(int l,int r,int L,int R,int w,int now){
pushdown(l,r,now);
if(l==L&&r==R){
lazy1[now]=w;
mn[now]=min(mn[now],w);
return;
}
if(L>mid)add1(mid+1,r,L,R,w,rs);
else if(R<=mid)add1(l,mid,L,R,w,ls);
else add1(l,mid,L,mid,w,ls),add1(mid+1,r,mid+1,R,w,rs);
update(now);
}
void add2(int l,int r,int L,int R,int w,int now){
if(L>R)return;
pushdown(l,r,now);
if(l==L&&r==R){
lazy2[now]=w;
mn[now]=min(l+w,mn[now]);
return;
}
if(L>mid)add2(mid+1,r,L,R,w,rs);
else if(R<=mid)add2(l,mid,L,R,w,ls);
else add2(l,mid,L,mid,w,ls),add2(mid+1,r,mid+1,R,w,rs);
update(now);
}
int check(int l,int r,int x,int now){
pushdown(l,r,now);
if(l==r)return mn[now];
if(x>mid)return check(mid+1,r,x,rs);
else return check(l,mid,x,ls);
}
int main(){
scanf("%s",s+1);
n=strlen(s+1);
m=122;
get_sa();get_height();
build(1,n,1);
for(int i=1;i<=n;i++){
int tmp=max(height[rk[i]],height[rk[i]+1])+1;
if(i+tmp-1<=n)add1(1,n,i,i+tmp-1,tmp,1);
add2(1,n,i+tmp,n,-i+1,1);
}
for(int i=1;i<=n;i++)printf("%d\n",check(1,n,i,1));
return 0;
}

BZOJ 2865 字符串识别(后缀数组+线段树)的更多相关文章

  1. BZOJ 2865 字符串识别 | 后缀数组 线段树

    集训讲字符串的时候我唯一想出正解的题-- 链接 BZOJ 2865 题面 给出一个长度为n (n <= 5e5) 的字符串,对于每一位,求包含该位的.最短的.在原串中只出现过一次的子串. 题解 ...

  2. bzoj 2865 字符串识别 —— 后缀数组

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=2865 唯一出现的子串就是每个后缀除去和别的后缀最长的 LCP 之外的前缀: 所以用这个更新一 ...

  3. bzoj 2865 字符串识别——后缀数组

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=2865 做出 ht[ ] 之后,sa[ ] 上每个位置和它前面与后面取 LCP ,其中较大的长 ...

  4. 【BZOJ4556】[TJOI2016&HEOI2016] 字符串(后缀自动机+线段树合并+二分)

    点此看题面 大致题意: 给你一个字符串\(s\),每次问你一个子串\(s[a..b]\)的所有子串和\(s[c..d]\)的最长公共前缀. 二分 首先我们可以发现一个简单性质,即要求最长公共前缀,则我 ...

  5. bzoj 1396: 识别子串 && bzoj 2865: 字符串识别【后缀数组+线段树】

    根据height数组的定义,和当前后缀串i最长的相同串的长度就是max(height[i],height[i+1]),这个后缀贡献的最短不同串长度就是len=max(height[i],height[ ...

  6. BZOJ 1396: 识别子串( 后缀数组 + 线段树 )

    这道题各位大神好像都是用后缀自动机做的?.....蒟蒻就秀秀智商写一写后缀数组解法..... 求出Height数组后, 我们枚举每一位当做子串的开头. 如上图(x, y是height值), Heigh ...

  7. BZOJ.1396.识别子串(后缀自动机/后缀数组 线段树)

    题目链接 SAM:能成为识别子串的只有那些|right|=1的节点代表的串. 设这个节点对应原串的右端点为r[i],则如果|right[i]|=1,即\(s[\ [r_i-len_i+1,r_i-le ...

  8. BZOJ 5496: [2019省队联测]字符串问题 (后缀数组+主席树优化建图+拓扑排序)

    题意 略 分析 考场上写了暴力建图40分溜了-(结果只得了30分) 然后只要优化建边就行了 首先给出的支配关系无法优化,就直接A向它支配的B连边. 考虑B向以B作为前缀的所有A连边,做一遍后缀数组,两 ...

  9. 【XSY1551】往事 广义后缀数组 线段树合并

    题目大意 给你一颗trie树,令\(s_i\)为点\(i\)到根的路径上的字符组成的字符串.求\(max_{u\neq v}(LCP(s_u,s_v)+LCS(s_u,s_v))\) \(LCP=\) ...

随机推荐

  1. 按时间划分备份MySQL脚本

    按时间划分备份MySQL脚本 #!/bin/bash BASE_PATH=/data/dump/ JIRA_FILE_NAME=ZY798-`date +%Y%m%d%H%M%S`; cd /usr/ ...

  2. Sona && Little Elephant and Array && Little Elephant and Array && D-query && Powerful array && Fast Queries (莫队)

    vjudge上莫队专题 真的是要吐槽自己(自己的莫队手残写了2个bug) s=sqrt(n) 是元素的个数而不是询问的个数(之所以是sqrt(n)使得左端点每个块左端点的范围嘴都是sqrt(n)) 在 ...

  3. 使用Git--将本地项目提交到Github

    前置工作 1. 在GitHub官网注册一个GitHub账号: 2. 安装git工具,在Git官网下载对应版本的Git: 方法一: 1. 进入Github首页,点击New repository新建一个项 ...

  4. 【Tool】 深度学习常用工具

    1. caffe 网络结构可视化 http://ethereon.github.io/netscope/quickstart.html 将网络结构复制粘贴到左侧的编辑框,按Shift+Enter就可以 ...

  5. 八、frps服务端与nginx可共用80端口

    我的服务器,已经用nginx 做网站了,80端口只有一个,我还想我的frps一起使用,可以吗?这个是可以实现的,利用nginx的反向代理实现. 以下是在frps服务器上安装的nginx配置文件中设置的 ...

  6. Cygwin(类UNIX模拟环境)&CURL(强大的http命令行工具)

    前言: 需要我用curl试下能否发送post请求调起公司的仿真系统(目前) 跟着大佬的脚步,亲测一把~ 感谢大佬的提供的博客和指导 @咩神 个人博客园及来源地址 Cygwin(类UNIX模拟环境) 一 ...

  7. HTML5 基础测试题

          HTML5 基础测试题 1.HTML5 之前的 HTML 版本是什么?() A.HTML 4.01 B.HTML 4 C.HTML 4.1 D.HTML 4.9 2.HTML5 的正确 d ...

  8. iText、poi操作word2007(读取,生成)

    关于生成word文件以及插入文字.表格.图片等功能,我使用了poi和itext,因为poi插入图片的jar包我在网上查并不是太完全,也可能我没找到如何使用,所以插入图片我用的是itext iText所 ...

  9. Mysql学习总结(35)——Mysql两千万数据优化及迁移

    最近有一张2000W条记录的数据表需要优化和迁移.2000W数据对于MySQL来说很尴尬,因为合理的创建索引速度还是挺快的,再怎么优化速度也得不到多大提升.不过这些数据有大量的冗余字段和错误信息,极不 ...

  10. Maven学习总结(23)——Maven常用命令介绍

    1.生成eclipse项目:mvn eclipse:eclipse 2.清除eclipse的一些系统设置:mvn eclipse:clean 3.mvn tomcat:run 在tomcat里面运行 ...