bzoj3473: 字符串 && bzoj3277串
3473: 字符串
Time Limit: 20 Sec Memory Limit: 256 MB
Submit: 121 Solved: 53
[Submit][Status][Discuss]
Description
Input
Output
Sample Input
abc
a
ab
Sample Output
HINT
对于 100% 的数据,1<=n,k<=10^5,所有字符串总长不超过10^5,字符串只包含小写字母。
Source
很久之前做的题今天一看竟然不会做了。。。于是补篇题解。
首先把所有串连起来做一遍SA,求出hight,然后在后缀数组上从前往后扫。
那么现在要求的就是当前这个后缀有多少前缀是至少k个串的子串,这些前缀一定是连续的一段,因为如果Sx出现了k次,那么S也一定出现了k次。
设当前位是i,我们现在拥有后缀数组上一位的答案lastans,那么把它与hight[i]取一个min得到x,那么这位的答案至少是x。
然后考虑这位新出现的子串,那些包含这些子串的位置一定在i下面,那么维护一个指针使当前区间内刚好包含k个不同串的任意一个后缀,当i++时指针往后扫。
那么指针的位置与i用ST表求个区间RMQ,用x与这个区间最小值取max就是当前位的答案。
复杂度$nlogn$
感觉后缀自动机的做法很不科学
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 300005
#define ll long long
using namespace std;
int n,k;
int sa[N],rank[N],wb[N],sum[N],c[N];
void getsa(int n,int m)
{
int *x=rank,*y=wb;
for(int i=0;i<m;i++)sum[i]=0;
for(int i=0;i<n;i++)sum[x[i]=c[i]]++;
for(int i=1;i<m;i++)sum[i]+=sum[i-1];
for(int i=n-1;i>=0;i--)sa[--sum[x[i]]]=i;
int p=1;
for(int j=1;p<n;j<<=1,m=p)
{
p=0;
for(int i=n-j;i<n;i++)y[p++]=i;
for(int i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(int i=0;i<m;i++)sum[i]=0;
for(int i=0;i<n;i++)sum[x[i]]++;
for(int i=1;i<m;i++)sum[i]+=sum[i-1];
for(int i=n-1;i>=0;i--)sa[--sum[x[y[i]]]]=y[i];
swap(x,y);x[sa[0]]=0;p=1;
for(int i=1;i<n;i++)
x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+j]==y[sa[i-1]+j]?p-1:p++;
}
}
int h[N];
void calh(int n)
{
for(int i=1;i<=n;i++)rank[sa[i]]=i;
int kk=0;
for(int i=0;i<n;i++)
{
if(kk)kk--;
int j=sa[rank[i]-1];
while(c[i+kk]==c[j+kk])kk++;
h[rank[i]]=kk;
}
return ;
}
int mn[N][20],lg[N];
void ST()
{
lg[0]=-1;
for(int i=1;i<=n;i++)lg[i]=lg[i>>1]+1;
for(int i=1;i<=n;i++)mn[i][0]=h[i];
for(int i=1;i<=19;i++)
{
for(int j=1;j<=n;j++)
{
if(j+(1<<(i-1))<=n)mn[j][i]=min(mn[j][i-1],mn[j+(1<<(i-1))][i-1]);
else mn[j][i]=mn[j][i-1];
}
}return ;
}
int qur(int l,int r)
{
int k=lg[r-l+1];
return min(mn[l][k],mn[r-(1<<k)+1][k]);
}
int be[N];
ll ans[N];
int len[N],sz[N];
int now[N],nw;
void solve()
{
int l=0;int tmp=0;
for(int i=1;i<=n;i++)
{
if(i!=1&&be[sa[i-1]]!=0)
{
now[be[sa[i-1]]]--;
if(!now[be[sa[i-1]]])nw--;
}
while(l!=n&&nw<k)
{
l++;
if(be[sa[l]]!=0)
{
now[be[sa[l]]]++;
if(now[be[sa[l]]]==1)nw++;
}
}
tmp=min(tmp,h[i]);
if(nw==k)
{
if(be[sa[i]])
{
int num;
if(l!=i)num=qur(i+1,l);
else num=sz[sa[i]];
tmp=max(tmp,num);
}
}
ans[be[sa[i]]]+=tmp;
}
return ;
}
char s[N];
int main()
{
int cnt;
scanf("%d%d",&cnt,&k);
int m=256;n=-1;
for(int i=1;i<=cnt;i++)
{
scanf("%s",s+1);len[i]=strlen(s+1);
for(int j=1;j<=len[i];j++)
{
c[++n]=s[j];
be[n]=i;
sz[n]=len[i]-j+1;
}
if(i!=cnt)c[++n]=m++;
}n++;
getsa(n+1,m);calh(n);
ST();
solve();
for(int i=1;i<cnt;i++)printf("%lld ",ans[i]);
printf("%lld",ans[cnt]);
return 0;
}
bzoj3473: 字符串 && bzoj3277串的更多相关文章
- bzoj3473字符串&bzoj3277串
题意:给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串.注意本质相同的子串多次出现算多次,如1 1 aaa这组数据答案为6,贡献1WA.代码里有些部分是为了 ...
- BZOJ3473&&BZOJ3277串
BZOJ3473&&BZOJ3277串 题面 自己找去 HINT 对于所有串建立一个广义后缀自动机,对于每一个节点开一个set表示这个节点接受的子串在哪些串里出现过,然后在parent ...
- 汇编语言从键盘输入一个字符串(串长不大于80)以十进制输出字符串中非字母字符的个数(不是a to z或 A to Z)
(1)从键盘输入一个字符串(串长不大于80). (2)以十进制输出字符串中非字母字符的个数(不是a to z或 A to Z). (3)输出原字符串且令非字母字符闪烁显示. (4)找出字符串中ASCI ...
- BZOJ3277 串 和 BZOJ3473 字符串
字符串 给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串? 分析 参照自为风月马前卒和Candy?的题解. 广义后缀自动机不就是把很多串的SAM建到了一个S ...
- BZOJ3277——串
0.题意:给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). 1.分析:这个题我问了吴大爷做法 首先建立后缀自动机,然后利用离线搞出每一个 ...
- PHP 中替换若干字符串字串为数组中的值,不用循环,非常高效
替换某个字符串中的一个或若干个字串为数组中某些值 php本身有自带的函数,可以不用循环非常高效的实现其效果: 实例代码: $phrase = "You should eat fruit ...
- BZOJ3473: 字符串
3473: 字符串 Time Limit: 20 Sec Memory Limit: 256 MBSubmit: 109 Solved: 47[Submit][Status] Descriptio ...
- SAP ABAP 处理字符串串串串串串串串(详细)
关于ABAP中处理字符串的方法,非常详细,学习过程中总结一下分享给大家,,, ABAP/4 提供多个处理类型 C 即字符串 的数据对象的关键字. 处理字符串 的方法有: 1.拆分字符串split 2. ...
- BZOJ3473: 字符串【后缀数组+思维】
Description 给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串? Input 第一行两个整数n,k. 接下来n行每行一个字符串. Output 一 ...
随机推荐
- Mysql读写分离——主从数据库+Atlas
mysql集群 最近在参加项目开发微信小程序后台,由于用户数量巨大,且后台程序并不是很完美,所以对用户的体验很是不友好(简单说就是很卡).赶巧最近正在翻阅<大型网站系统与Java中间件实践> ...
- C++STL 中的容器整体/逐元素操作方法 少写80%for循环
本文中示例代码默认已引用 std 命名空间 累加 (std::accumulate) accumulate(begin, end, init, op) 返回给定区间内元素的累加值与给定初值的和,初值不 ...
- Git常用使用技巧
- 此随笔不是使用教材,使用教材参照git官方文档和相应博客 - 此随笔不是转载而来,涉及不少三方链接,再次表示感谢 - 此随便乃实践中碰到的问题,增加开发效率,干货满满 git 撤销某次提交的技巧: ...
- 【推荐系统】neural_collaborative_filtering(源码解析)
很久没看推荐系统相关的论文了,最近发现一篇2017年的论文,感觉不错. 原始论文 https://arxiv.org/pdf/1708.05031.pdf 网上有翻译了 https://www.cnb ...
- 机器学习基础 --- pandas的基本使用
一.pandas的简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些 ...
- TensorFlow中的卷积函数
前言 最近尝试看TensorFlow中Slim模块的代码,看的比较郁闷,所以试着写点小的代码,动手验证相关的操作,以增加直观性. 卷积函数 slim模块的conv2d函数,是二维卷积接口,顺着源代码可 ...
- 简单安装与使用虚拟环境virtualenv
安装虚拟环境的命令如下: sudo pip install virtualenv sudo pip install virtualenvwrapper 创建虚拟环境的命令如下: mkvirtualen ...
- [T-ARA][느낌 아니까][懂得那份感觉]
歌词来源:http://music.163.com/#/song?id=27808771 作曲 : 박덕상/박현중 [作曲 : p/bag-ddeog-ssang-/p/ba-Kyeon-c/jung ...
- paste命令详解
基础命令学习目录首页 原文链接:https://blog.csdn.net/u011341352/article/details/52806312 个人分类: linux paste命令和cut命 ...
- 互评Beta版本——二次元梦之队——“I Do”
基于NABCD评论作品,及改进建议 1.根据(不限于)NABCD评论作品的选题 (1)N(Need,需求) 这是一款可以教学新手入门编程的软件,不断的通关让他们慢慢学会编程,可以让没有接触过编程的人了 ...