bzoj3277 串 (后缀数组+二分答案+ST表)
常见操作:先把所有串都连到一起,但中间加上一个特殊的符号(不能在原串中/出现过)作为分割
由于全部的子串就等于所有后缀的所有前缀,那我们对于每一个后缀,去求一个最长的前缀,来满足这个前缀在至少K个原串中出现过
那我们就二分一下这个前缀的长度。现在的问题就是怎么判断这个前缀是否在K个串中出现过了。
显然,对于一个后缀s的长度为x的前缀,只要某个后缀t 和s的LCP>=x,就说明x也是t的后缀
我们知道,LCP(x,y)=min{height[rank[y]],height[rank[y]-1],...,height[rank[x]+1]},所以其实t和s的LCP也是单调的,满足条件的是一个排名区间
那我们用二分出来这个区间的左右端点(用st表预处理一下height的区间最小值),然后只要判断这个区间里的后缀是否满足出现在K个串中就可以了
我们只要提前处理出来left[i],表示一个最大的排名,使得sa[left[i]]...sa[i]在不同串中出现次数>=K,然后判断我刚二分出来的那个区间[l,r],是否l<=left[r]就可以了
复杂度$O(nlog^2n)$,据说有点卡常,那稍微优化一下
我们第一次二分前缀的长度的时候,显然现在在做的的最大的长度一定是>=(上一个后缀的最大前缀长度-1)的,所以只要像求height那样推着做就可以了
据说均摊复杂度O(nlogn)
(第一次写后缀数组各种懵...最后还是全都照着大佬的题解抄的...)
#include<bits/stdc++.h>
#define pa pair<int,int>
#define ll long long
using namespace std;
const int maxn=2e5+; inline ll rd(){
ll x=;char c=getchar();int neg=;
while(c<''||c>''){if(c=='-') neg=-;c=getchar();}
while(c>=''&&c<='') x=x*+c-'',c=getchar();
return x*neg;
} int NN,N,M,K;
char ch[maxn];
int suf[maxn],rank[maxn],rank1[maxn],cnt[maxn],tmp[maxn];
int h[maxn],left0[maxn],bel[maxn],st[maxn][],pos[maxn][]; inline void getsuf(){
int i,j,k;M=;
for(i=;i<=N;i++) cnt[ch[i]]=;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) rank[i]=cnt[ch[i]];
for(k=;j!=N;k<<=){
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i+k>N?:i+k]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) tmp[cnt[rank[i+k>N?:i+k]]--]=i;
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) suf[cnt[rank[tmp[i]]]--]=tmp[i];
memcpy(rank1,rank,sizeof(rank));
rank[suf[]]=j=;
for(i=;i<=N;i++){
int ipk=suf[i]+k>N?:suf[i]+k,i1pk=suf[i-]+k>N?:suf[i-]+k;
if(rank1[ipk]!=rank1[i1pk]||rank1[suf[i]]!=rank1[suf[i-]]) j++;
rank[suf[i]]=j;
}M=j;
}
for(i=;i<=N;i++) suf[rank[i]]=i;
} inline void geth(){
//h[1]=1;
for(int i=,j=;i<=N;i++){
if(rank[i]==) continue;
if(j) j--;
int x=suf[rank[i]-];
while(i+j<=N&&x+j<=N&&ch[i+j]==ch[x+j]) j++;
h[rank[i]]=j;
}
} inline void getleft0(){
int n=;
memset(cnt,,sizeof(cnt));
for(int i=,j=;i<=N;i++){
if(ch[suf[i]]=='z'+) continue;
if(!cnt[bel[suf[i]]]) n++;
cnt[bel[suf[i]]]++;
if(n>=K){
for(;n-(cnt[bel[suf[j]]]==)>=K;n-=(cnt[bel[suf[j++]]]==)) cnt[bel[suf[j]]]--;
left0[i]=j;
}
}
} inline void getst(){
for(int i=N;i;i--){
st[i][]=h[i];
for(int j=;st[i+(<<(j-))][j-];j++){
st[i][j]=min(st[i][j-],st[i+(<<(j-))][j-]);
}
}
} inline int rmq(int l,int r){
int k=log2(r-l+);
return min(st[l][k],st[r-(<<k)+][k]);
} inline bool check(int p,int x){
int l,r,l0,r0;
if(h[p+]<x) r0=p;
else{
l=p+;r=N;
while(l<=r){
int m=(l+r)>>;
if(rmq(p+,m)>=x)r0=m,l=m+;
else r=m-;
}
}
if(h[p]<x) l0=p;
else{
l=;r=p;
while(l<=r){
// printf("%d %d\n",l,r);
int m=(l+r)>>;
if(rmq(m,p)>=x) l0=m,r=m-;
else l=m+;
}l0--;
}
return left0[r0]>=l0;
} inline void solve(){
for(int i=;i<=NN;i++){
int k=;ll ans=;
for(int j=pos[i][];j<pos[i][];j++){
if(k) k--;
for(;j+k<pos[i][]&&check(rank[j],k+);k++);
ans=ans+k;
}
printf("%lld ",ans);
}printf("\n");
} int main(){
//freopen("3277.in","r",stdin);
// freopen("aa.out","w",stdout);
int i,j,k;
N=NN=rd(),K=rd();
for(i=,j=;i<=N;i++){
pos[i][]=j;
scanf("%s",ch+j);k=strlen(ch+j);
ch[j+k]='z'+;
for(int t=j;t<j+k;t++) bel[t]=i;
j=j+k+;
pos[i][]=j-;
}N=j-;
getsuf();
geth();
getleft0();
getst();
solve();
return ;
}
bzoj3277 串 (后缀数组+二分答案+ST表)的更多相关文章
- [BZOJ3277/BZOJ3473] 串 - 后缀数组,二分,双指针,ST表,均摊分析
[BZOJ3277] 串 Description 现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). Solution 首先将所有串连 ...
- BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案
BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l 读入单 ...
- Poj 1743 Musical Theme(后缀数组+二分答案)
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...
- Poj 3261 Milk Patterns(后缀数组+二分答案)
Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...
- BZOJ 4556: [Tjoi2016&Heoi2016]字符串(后缀数组 + 二分答案 + 主席树 + ST表 or 后缀数组 + 暴力)
题意 一个长为 \(n\) 的字符串 \(s\),和 \(m\) 个询问.每次询问有 \(4\) 个参数分别为 \(a,b,c,d\). 要你告诉它 \(s[a...b]\) 中的所有子串 和 \(s ...
- BZOJ3277 串(后缀数组+二分答案+主席树)
因为不会SAM,考虑SA.将所有串连起来并加分隔符,每次考虑计算以某个位置开始的子串有多少个合法. 对此首先二分答案,找到名次数组上的一个区间,那么只需要统计有多少个所给串在该区间内出现就可以了.这是 ...
- [HEOI2016] 字符串 - 后缀数组,主席树,ST表,二分
[HEOI2016] 字符串 Description 给定一个字符串 \(S\), 有 \(m\) 个询问,每个询问给定参数 \((a,b,c,d)\) ,求 \(s[a..b]\) 的子串与 \(s ...
- 跳蚤[BZOJ4310](后缀数组+二分答案传判定)
不知道后缀数组的请退回去! 题面: 题目描述 很久很久以前,森林里住着一群跳蚤.一天,跳蚤国王得到了一个神秘的字符串,它想进行研究.首先,他会把串分成不超过 k 个子串,然后对于每个子串 S,他会从S ...
- 【BZOJ2946】[Poi2000]公共串 后缀数组+二分
[BZOJ2946][Poi2000]公共串 Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l 读入单词 l 计 ...
随机推荐
- Python 学习 第一篇:数据类型(数字,集合,布尔类型,操作符)
Python语言最常用的对象是变量和常量,常量的值是字面意思,其值是不可变的,变量的值是可变的,例如,123,"上海"是常量,而a=1,a=2,其中a是变量名.内置的核心数据类型有 ...
- HBase最佳实践-管好你的操作系统
本文由 网易云发布. 作者:范欣欣 本篇文章仅限本站分享,如需转载,请联系网易获取授权. 操作系统这个话题其实很早就想拿出来和大家分享,拖到现在一方面是因为对其中各种理论理解并不十分透彻,怕讲不好: ...
- 给echarts加个“全屏展示”
echarts的工具箱并没有提供放大/全屏的功能, 查找文档发现可自定义工具https://www.echartsjs.com/option.html#toolbox.feature show代码 t ...
- 用PHP山寨一款软件
什么是我国软件工程师引以为豪的能力?山寨.山寨,山寨! 我国程序员的山寨能力是世界一流的.这一点在世界范围内令人闻风丧胆.世界上根本就找不到一款我国工程师不能山寨的软件. 今天,锋哥教大家来山寨一款软 ...
- 图像数据增强 (Data Augmentation in Computer Vision)
1.1 简介 深层神经网络一般都需要大量的训练数据才能获得比较理想的结果.在数据量有限的情况下,可以通过数据增强(Data Augmentation)来增加训练样本的多样性, 提高模型鲁棒性,避免过拟 ...
- centos7下安装php+memcached简单记录
1)centos7下安装php 需要再添加一个yum源来安装php-fpm,可以使用webtatic(这个yum源对国内网络来说恐怕有些慢,当然你也可以选择其它的yum源) [root@nextclo ...
- js 时间戳转换为日期格式
//将1525854409000类型的时间转换成“yyyy-MM-dd”或“yyyy-MM-dd hh:mm:ss” //info.birthday是后台获取到的Date类型的出生日期数据, / ...
- 关于git的一些体会:
周忠贤github链接:https://github.com/zhouzhongxian git学习心得:通过这次的学习,体会到了许多东西只要你用心去做,就没有什么做不成,,这次体会到了网上学习的重要 ...
- enumerate()函数用法
enumerate 函数用于遍历序列中的元素以及它们的下标:
- Quartz中时间表达式的设置-----corn表达式 (转)(http://www.cnblogs.com/GarfieldTom/p/3746290.html)
Quartz中时间表达式的设置-----corn表达式 (注:这是让我看比较明白的一个博文,但是抱歉,没有找到原作者,如有侵犯,请告知) 时间格式: <!-- s m h d m w(?) y( ...