bzoj3277 串 (后缀数组+二分答案+ST表)
常见操作:先把所有串都连到一起,但中间加上一个特殊的符号(不能在原串中/出现过)作为分割
由于全部的子串就等于所有后缀的所有前缀,那我们对于每一个后缀,去求一个最长的前缀,来满足这个前缀在至少K个原串中出现过
那我们就二分一下这个前缀的长度。现在的问题就是怎么判断这个前缀是否在K个串中出现过了。
显然,对于一个后缀s的长度为x的前缀,只要某个后缀t 和s的LCP>=x,就说明x也是t的后缀
我们知道,LCP(x,y)=min{height[rank[y]],height[rank[y]-1],...,height[rank[x]+1]},所以其实t和s的LCP也是单调的,满足条件的是一个排名区间
那我们用二分出来这个区间的左右端点(用st表预处理一下height的区间最小值),然后只要判断这个区间里的后缀是否满足出现在K个串中就可以了
我们只要提前处理出来left[i],表示一个最大的排名,使得sa[left[i]]...sa[i]在不同串中出现次数>=K,然后判断我刚二分出来的那个区间[l,r],是否l<=left[r]就可以了
复杂度$O(nlog^2n)$,据说有点卡常,那稍微优化一下
我们第一次二分前缀的长度的时候,显然现在在做的的最大的长度一定是>=(上一个后缀的最大前缀长度-1)的,所以只要像求height那样推着做就可以了
据说均摊复杂度O(nlogn)
(第一次写后缀数组各种懵...最后还是全都照着大佬的题解抄的...)
#include<bits/stdc++.h>
#define pa pair<int,int>
#define ll long long
using namespace std;
const int maxn=2e5+; inline ll rd(){
ll x=;char c=getchar();int neg=;
while(c<''||c>''){if(c=='-') neg=-;c=getchar();}
while(c>=''&&c<='') x=x*+c-'',c=getchar();
return x*neg;
} int NN,N,M,K;
char ch[maxn];
int suf[maxn],rank[maxn],rank1[maxn],cnt[maxn],tmp[maxn];
int h[maxn],left0[maxn],bel[maxn],st[maxn][],pos[maxn][]; inline void getsuf(){
int i,j,k;M=;
for(i=;i<=N;i++) cnt[ch[i]]=;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) rank[i]=cnt[ch[i]];
for(k=;j!=N;k<<=){
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i+k>N?:i+k]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) tmp[cnt[rank[i+k>N?:i+k]]--]=i;
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) suf[cnt[rank[tmp[i]]]--]=tmp[i];
memcpy(rank1,rank,sizeof(rank));
rank[suf[]]=j=;
for(i=;i<=N;i++){
int ipk=suf[i]+k>N?:suf[i]+k,i1pk=suf[i-]+k>N?:suf[i-]+k;
if(rank1[ipk]!=rank1[i1pk]||rank1[suf[i]]!=rank1[suf[i-]]) j++;
rank[suf[i]]=j;
}M=j;
}
for(i=;i<=N;i++) suf[rank[i]]=i;
} inline void geth(){
//h[1]=1;
for(int i=,j=;i<=N;i++){
if(rank[i]==) continue;
if(j) j--;
int x=suf[rank[i]-];
while(i+j<=N&&x+j<=N&&ch[i+j]==ch[x+j]) j++;
h[rank[i]]=j;
}
} inline void getleft0(){
int n=;
memset(cnt,,sizeof(cnt));
for(int i=,j=;i<=N;i++){
if(ch[suf[i]]=='z'+) continue;
if(!cnt[bel[suf[i]]]) n++;
cnt[bel[suf[i]]]++;
if(n>=K){
for(;n-(cnt[bel[suf[j]]]==)>=K;n-=(cnt[bel[suf[j++]]]==)) cnt[bel[suf[j]]]--;
left0[i]=j;
}
}
} inline void getst(){
for(int i=N;i;i--){
st[i][]=h[i];
for(int j=;st[i+(<<(j-))][j-];j++){
st[i][j]=min(st[i][j-],st[i+(<<(j-))][j-]);
}
}
} inline int rmq(int l,int r){
int k=log2(r-l+);
return min(st[l][k],st[r-(<<k)+][k]);
} inline bool check(int p,int x){
int l,r,l0,r0;
if(h[p+]<x) r0=p;
else{
l=p+;r=N;
while(l<=r){
int m=(l+r)>>;
if(rmq(p+,m)>=x)r0=m,l=m+;
else r=m-;
}
}
if(h[p]<x) l0=p;
else{
l=;r=p;
while(l<=r){
// printf("%d %d\n",l,r);
int m=(l+r)>>;
if(rmq(m,p)>=x) l0=m,r=m-;
else l=m+;
}l0--;
}
return left0[r0]>=l0;
} inline void solve(){
for(int i=;i<=NN;i++){
int k=;ll ans=;
for(int j=pos[i][];j<pos[i][];j++){
if(k) k--;
for(;j+k<pos[i][]&&check(rank[j],k+);k++);
ans=ans+k;
}
printf("%lld ",ans);
}printf("\n");
} int main(){
//freopen("3277.in","r",stdin);
// freopen("aa.out","w",stdout);
int i,j,k;
N=NN=rd(),K=rd();
for(i=,j=;i<=N;i++){
pos[i][]=j;
scanf("%s",ch+j);k=strlen(ch+j);
ch[j+k]='z'+;
for(int t=j;t<j+k;t++) bel[t]=i;
j=j+k+;
pos[i][]=j-;
}N=j-;
getsuf();
geth();
getleft0();
getst();
solve();
return ;
}
bzoj3277 串 (后缀数组+二分答案+ST表)的更多相关文章
- [BZOJ3277/BZOJ3473] 串 - 后缀数组,二分,双指针,ST表,均摊分析
[BZOJ3277] 串 Description 现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). Solution 首先将所有串连 ...
- BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案
BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l 读入单 ...
- Poj 1743 Musical Theme(后缀数组+二分答案)
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...
- Poj 3261 Milk Patterns(后缀数组+二分答案)
Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...
- BZOJ 4556: [Tjoi2016&Heoi2016]字符串(后缀数组 + 二分答案 + 主席树 + ST表 or 后缀数组 + 暴力)
题意 一个长为 \(n\) 的字符串 \(s\),和 \(m\) 个询问.每次询问有 \(4\) 个参数分别为 \(a,b,c,d\). 要你告诉它 \(s[a...b]\) 中的所有子串 和 \(s ...
- BZOJ3277 串(后缀数组+二分答案+主席树)
因为不会SAM,考虑SA.将所有串连起来并加分隔符,每次考虑计算以某个位置开始的子串有多少个合法. 对此首先二分答案,找到名次数组上的一个区间,那么只需要统计有多少个所给串在该区间内出现就可以了.这是 ...
- [HEOI2016] 字符串 - 后缀数组,主席树,ST表,二分
[HEOI2016] 字符串 Description 给定一个字符串 \(S\), 有 \(m\) 个询问,每个询问给定参数 \((a,b,c,d)\) ,求 \(s[a..b]\) 的子串与 \(s ...
- 跳蚤[BZOJ4310](后缀数组+二分答案传判定)
不知道后缀数组的请退回去! 题面: 题目描述 很久很久以前,森林里住着一群跳蚤.一天,跳蚤国王得到了一个神秘的字符串,它想进行研究.首先,他会把串分成不超过 k 个子串,然后对于每个子串 S,他会从S ...
- 【BZOJ2946】[Poi2000]公共串 后缀数组+二分
[BZOJ2946][Poi2000]公共串 Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l 读入单词 l 计 ...
随机推荐
- Luogu P3825 [NOI2017]游戏
这道题看上去NPC啊,超级不可做的样子. 我们先分析一下简单的情形:没有\(x\)地图 此时每个地图由于限制掉一种汽车,那么显然只会有两种选择. 再考虑到限制的情况,那么大致做法就很显然了--2-SA ...
- springboot 中事件监听模型的一种实现
目录 定义事件本身 定义事件源 定义监听者 一.需要实现 ApplicationListener 二.使用 @EventListener 注解 测试 项目结构 前言: 事件监听模型是一种常用的设计模式 ...
- MATLAB找不到遗传算法工具箱,用不了gatool命令的解决方案
解决方案 官方解释如下: gatool was removed as of R2015b. Use optimtool 在MATLAB R2015b前的版本可以使用gatool调用遗传算法工具箱,我测 ...
- BugkuCTF 计算器
前言 写了这么久的web题,算是把它基础部分都刷完了一遍,以下的几天将持续更新BugkuCTF WEB部分的题解,为了不影响阅读,所以每道题的题解都以单独一篇文章的形式发表,感谢大家一直以来的支持和理 ...
- [原]Veracrypt使用Yubikey作为安全令牌
今天刚刚到货Yubikey 5 美亚 直邮 ,易客满国际,国内居然是顺丰配送,点个赞. 必备的控件 https://developers.yubico.com/yubikey-manager-qt/R ...
- libmysqlclient.so.16: cannot open shared object file: No such file or directory
编译安装的mysql5.6.39,安装目录是/usr/local/mysql,启用程序时报错:libmysqlclient.so.16: cannot open shared object file: ...
- webvirtmgr-重命名kvm虚拟机的名称
之前部署了Webvirtmgr平台管理kvm虚拟机,由于虚拟机在创建时名称是顺便起的,后续在虚拟机上部署了部分业务.为了便于管理,最好将虚拟机的名称重置下. 现在说下如何修改kvm中虚拟机的名称: 比 ...
- 初学习Qt的一些感悟
最近用Qt写了个人项目,有如下心得(可能有不准确): Qt尽管没有扩展C++语法,但是有额外编译链,每个Q_OBJECT类编译的时候会用moc工具生成另一个meta C++类,之后就是标准C++编译流 ...
- M1/M2阶段总结
之前提问的博客 问题解答 问题 1 关于代码复审,复审者是否应该参与编码?如果复审者也参与编码的话,那么难免任务量较多,但如果不参与编码的话,工作分配的似乎不太均衡. 我们的团队项目在M1和M2阶段没 ...
- Linux内核分析-创建新进程的过程
分析Linux内核创建一个新进程的过程 task_struct结构体分析 struct task_struct{ volatile long state; //进程的状态 unsigned long ...