常见操作:先把所有串都连到一起,但中间加上一个特殊的符号(不能在原串中/出现过)作为分割

由于全部的子串就等于所有后缀的所有前缀,那我们对于每一个后缀,去求一个最长的前缀,来满足这个前缀在至少K个原串中出现过

那我们就二分一下这个前缀的长度。现在的问题就是怎么判断这个前缀是否在K个串中出现过了。

显然,对于一个后缀s的长度为x的前缀,只要某个后缀t 和s的LCP>=x,就说明x也是t的后缀

我们知道,LCP(x,y)=min{height[rank[y]],height[rank[y]-1],...,height[rank[x]+1]},所以其实t和s的LCP也是单调的,满足条件的是一个排名区间

那我们用二分出来这个区间的左右端点(用st表预处理一下height的区间最小值),然后只要判断这个区间里的后缀是否满足出现在K个串中就可以了

我们只要提前处理出来left[i],表示一个最大的排名,使得sa[left[i]]...sa[i]在不同串中出现次数>=K,然后判断我刚二分出来的那个区间[l,r],是否l<=left[r]就可以了

复杂度$O(nlog^2n)$,据说有点卡常,那稍微优化一下

我们第一次二分前缀的长度的时候,显然现在在做的的最大的长度一定是>=(上一个后缀的最大前缀长度-1)的,所以只要像求height那样推着做就可以了

据说均摊复杂度O(nlogn)

(第一次写后缀数组各种懵...最后还是全都照着大佬的题解抄的...)

 #include<bits/stdc++.h>
#define pa pair<int,int>
#define ll long long
using namespace std;
const int maxn=2e5+; inline ll rd(){
ll x=;char c=getchar();int neg=;
while(c<''||c>''){if(c=='-') neg=-;c=getchar();}
while(c>=''&&c<='') x=x*+c-'',c=getchar();
return x*neg;
} int NN,N,M,K;
char ch[maxn];
int suf[maxn],rank[maxn],rank1[maxn],cnt[maxn],tmp[maxn];
int h[maxn],left0[maxn],bel[maxn],st[maxn][],pos[maxn][]; inline void getsuf(){
int i,j,k;M=;
for(i=;i<=N;i++) cnt[ch[i]]=;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) rank[i]=cnt[ch[i]];
for(k=;j!=N;k<<=){
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i+k>N?:i+k]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) tmp[cnt[rank[i+k>N?:i+k]]--]=i;
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) suf[cnt[rank[tmp[i]]]--]=tmp[i];
memcpy(rank1,rank,sizeof(rank));
rank[suf[]]=j=;
for(i=;i<=N;i++){
int ipk=suf[i]+k>N?:suf[i]+k,i1pk=suf[i-]+k>N?:suf[i-]+k;
if(rank1[ipk]!=rank1[i1pk]||rank1[suf[i]]!=rank1[suf[i-]]) j++;
rank[suf[i]]=j;
}M=j;
}
for(i=;i<=N;i++) suf[rank[i]]=i;
} inline void geth(){
//h[1]=1;
for(int i=,j=;i<=N;i++){
if(rank[i]==) continue;
if(j) j--;
int x=suf[rank[i]-];
while(i+j<=N&&x+j<=N&&ch[i+j]==ch[x+j]) j++;
h[rank[i]]=j;
}
} inline void getleft0(){
int n=;
memset(cnt,,sizeof(cnt));
for(int i=,j=;i<=N;i++){
if(ch[suf[i]]=='z'+) continue;
if(!cnt[bel[suf[i]]]) n++;
cnt[bel[suf[i]]]++;
if(n>=K){
for(;n-(cnt[bel[suf[j]]]==)>=K;n-=(cnt[bel[suf[j++]]]==)) cnt[bel[suf[j]]]--;
left0[i]=j;
}
}
} inline void getst(){
for(int i=N;i;i--){
st[i][]=h[i];
for(int j=;st[i+(<<(j-))][j-];j++){
st[i][j]=min(st[i][j-],st[i+(<<(j-))][j-]);
}
}
} inline int rmq(int l,int r){
int k=log2(r-l+);
return min(st[l][k],st[r-(<<k)+][k]);
} inline bool check(int p,int x){
int l,r,l0,r0;
if(h[p+]<x) r0=p;
else{
l=p+;r=N;
while(l<=r){
int m=(l+r)>>;
if(rmq(p+,m)>=x)r0=m,l=m+;
else r=m-;
}
}
if(h[p]<x) l0=p;
else{
l=;r=p;
while(l<=r){
// printf("%d %d\n",l,r);
int m=(l+r)>>;
if(rmq(m,p)>=x) l0=m,r=m-;
else l=m+;
}l0--;
}
return left0[r0]>=l0;
} inline void solve(){
for(int i=;i<=NN;i++){
int k=;ll ans=;
for(int j=pos[i][];j<pos[i][];j++){
if(k) k--;
for(;j+k<pos[i][]&&check(rank[j],k+);k++);
ans=ans+k;
}
printf("%lld ",ans);
}printf("\n");
} int main(){
//freopen("3277.in","r",stdin);
// freopen("aa.out","w",stdout);
int i,j,k;
N=NN=rd(),K=rd();
for(i=,j=;i<=N;i++){
pos[i][]=j;
scanf("%s",ch+j);k=strlen(ch+j);
ch[j+k]='z'+;
for(int t=j;t<j+k;t++) bel[t]=i;
j=j+k+;
pos[i][]=j-;
}N=j-;
getsuf();
geth();
getleft0();
getst();
solve();
return ;
}

bzoj3277 串 (后缀数组+二分答案+ST表)的更多相关文章

  1. [BZOJ3277/BZOJ3473] 串 - 后缀数组,二分,双指针,ST表,均摊分析

    [BZOJ3277] 串 Description 现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). Solution 首先将所有串连 ...

  2. BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案

    BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description          给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单 ...

  3. Poj 1743 Musical Theme(后缀数组+二分答案)

    Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...

  4. Poj 3261 Milk Patterns(后缀数组+二分答案)

    Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...

  5. BZOJ 4556: [Tjoi2016&Heoi2016]字符串(后缀数组 + 二分答案 + 主席树 + ST表 or 后缀数组 + 暴力)

    题意 一个长为 \(n\) 的字符串 \(s\),和 \(m\) 个询问.每次询问有 \(4\) 个参数分别为 \(a,b,c,d\). 要你告诉它 \(s[a...b]\) 中的所有子串 和 \(s ...

  6. BZOJ3277 串(后缀数组+二分答案+主席树)

    因为不会SAM,考虑SA.将所有串连起来并加分隔符,每次考虑计算以某个位置开始的子串有多少个合法. 对此首先二分答案,找到名次数组上的一个区间,那么只需要统计有多少个所给串在该区间内出现就可以了.这是 ...

  7. [HEOI2016] 字符串 - 后缀数组,主席树,ST表,二分

    [HEOI2016] 字符串 Description 给定一个字符串 \(S\), 有 \(m\) 个询问,每个询问给定参数 \((a,b,c,d)\) ,求 \(s[a..b]\) 的子串与 \(s ...

  8. 跳蚤[BZOJ4310](后缀数组+二分答案传判定)

    不知道后缀数组的请退回去! 题面: 题目描述 很久很久以前,森林里住着一群跳蚤.一天,跳蚤国王得到了一个神秘的字符串,它想进行研究.首先,他会把串分成不超过 k 个子串,然后对于每个子串 S,他会从S ...

  9. 【BZOJ2946】[Poi2000]公共串 后缀数组+二分

    [BZOJ2946][Poi2000]公共串 Description        给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单词 l        计 ...

随机推荐

  1. [Spark][Python]Wordcount 例子

    [training@localhost ~]$ hdfs dfs -cat cats.txt The cat on the matThe aardvark sat on the sofa[traini ...

  2. BZOJ 3561 DZY Loves Math VI

    BZOJ 3561 DZY Loves Math VI 求\(\sum_{i=1}^{n}\sum_{j=1}^{m}\text{lcm}(i,j)^{\gcd(i,j)}\),钦定\(n\leq m ...

  3. #个人博客作业Week1——流行的源程序版本管理软件和项目管理软件

    1.TFS(Team Foundation Server)(1)定义:TFS是一个高可扩展.高可用.高性能.面向互联网服务的分布式文件系统,主要针对海量的非结构化数据,          它构筑在普通 ...

  4. Bing词典分析

    0x01 Bug测试结果 本次测试的是Bing词典wp版本V4.5.2,经过测试,共发现如下Bug. 1.更新后,旧版本首页的每日单词与文章推荐不能重新获得,部分搜索历史记录丢失. 2.在单词挑战模式 ...

  5. 使用Junit进行单元测试

    使用Junit进行单元测试 一.目的和要求 JUnit是一款由Erich Gamma(<设计模式>的作者)和Kent Beck(极限编程的提出者)编写的开源的回归测试框架,供Java编码人 ...

  6. iOS推送证书生成pem文件(详细步骤)

    1.pem文件概述 pem文件是服务器向苹果服务器做推送时候需要的文件,主要是给php向苹果服务器验证时使用,下面介绍一下pem文件的生成. 2.生成pem文件步骤 1.打开钥匙串,选择需要生成的推送 ...

  7. 自己实现数据结构系列二---LinkedList

    一.先上代码: 1.方式一: public class LinkedList<E> { //节点,用来存放数据:数据+下一个元素的引用 private class Node{ privat ...

  8. Activiti reassign task to another user

    //早先胡乱尝试的其他方法,可能对于以后深入学习Activiti有些用处. //taskService.delegateTask(taskId, receiveUserId); //taskServi ...

  9. [转帖]ASP.NET Core的Kestrel服务器

    ASP.NET Core的Kestrel服务器 https://cloud.tencent.com/developer/article/1023247 在这篇文章中: 何时使用Kestrel和反向代理 ...

  10. 【转帖】互联网加密及OpenSSL介绍和简单使用

    转帖:https://mritd.me/2016/07/02/%E4%BA%92%E8%81%94%E7%BD%91%E5%8A%A0%E5%AF%86%E5%8F%8AOpenSSL%E4%BB%8 ...