bzoj4032-最短不公共子串
题意
给出两个长度小于等于2000的小写字母串,四个问题:
- A的最短子串不是B的子串
- A的最短子串不是B的子序列
- A的最短子序列不是B的子串
- A的最短子序列不是B的子序列
分析
虽然求的是不公共,但是这还是一个字符串的匹配问题,只不过是求匹配不到。
对于子串的匹配问题,可以使用后缀自动机。然而对于子序列的匹配问题,提出一种新的数据结构,称为子序列自动机。
子序列自动机是一个能够跑出一个串的所有子序列的有限状态机,基本思路是每个点存每一种字符下一次出现位置的点,这样就可以保证跑出所有的子序列,并且状态数是\(O(n)\)的。子序列自动机的构建方法很简单,只要从后往前扫一次,维护每个字符最后出现的位置即可,所以它只支持在前端添加字符。
这样的子序列自动机的空间复杂度都是\(O(n|s|)\),其中\(s\)为字符集。构建的时间复杂度为\(O(n|s|)\),一次转移是\(O(1)\)的。
然而如果字符集过大,这样的复杂度很明显是不能被支持的。注意到这其实是一个从后往前扫的过程,不断地维护一个序列,所以我们可以把这个数组换成一个可持久化线段树,那么这样的空间复杂度,构建复杂的都是\(O(nlog|s|)\),一次转移就变成了\(O(log|s|)\)。
那么前两问就直接枚举A串的左端点,直接在两种自动机上跑一下即可。
后两问是与子序列有关的,所以可以考虑动态规划。设\(f[i]\)表示在自动机上走到\(i\)号点至少是多长的子序列,那么每次扫描每个点,往后转移一下即可。最终答案为\(f[null]\)(或程序中的\(f[0]\),即空状态)。
代码
#include<cstdio>
#include<cctype>
#include<cstring>
#include<algorithm>
#define print(x) printf("%d\n",x==inf?-1:x)
using namespace std;
int read(int a[]) {
char c=getchar();
int len=0;
for (;!isalpha(c);c=getchar());
for (;isalpha(c);c=getchar()) a[++len]=c-'a'+1;
return len;
}
const int maxn=2e3+10;
const int maxc=27;
const int inf=0x3f3f3f3f;
int a[maxn],b[maxn];
int n,m,f[maxn][maxn<<1];
struct SAM {
int t[maxn<<1][maxc],len[maxn<<1],link[maxn<<1],tot,last;
SAM ():tot(1),last(1) {}
void add(int x) {
int nw=++tot,i;
len[nw]=len[last]+1;
for (i=last;i && !t[i][x];i=link[i]) t[i][x]=nw;
if (i) {
int p=t[i][x];
if (len[p]==len[i]+1) link[nw]=p; else {
int q=++tot;
len[q]=len[i]+1;
for (int j=i;j && t[j][x]==p;j=link[j]) t[j][x]=q;
link[q]=link[p];
link[p]=link[nw]=q;
memcpy(t[q],t[p],sizeof t[p]);
}
} else link[nw]=1;
last=nw;
}
void build(int a[],int n) {
for (int i=1;i<=n;++i) add(a[i]);
}
int run(int a[],int n) {
int now=1;
for (int i=1;i<=n;++i) if (t[now][a[i]]) now=t[now][a[i]]; else return i;
return inf;
}
int size() {
return tot;
}
} sam;
struct LAM {
int t[maxn][maxc],aux[maxc],tot;
void build(int a[],int n) {
tot=n+1;
for (int i=n;i;--i) {
memcpy(t[i+1],aux,sizeof aux);
aux[a[i]]=i+1;
}
memcpy(t[1],aux,sizeof aux);
}
int run(int a[],int n) {
int now=1;
for (int i=1;i<=n;++i) if (t[now][a[i]]) now=t[now][a[i]]; else {
return i;
}
return inf;
}
int size() {
return tot;
}
} lam;
void up(int &x,int y) {
x=min(x,y);
}
void one() {
int ans=inf;
for (int i=1;i<=n;++i)
up(ans,sam.run(a+i-1,n-i+1));
print(ans);
}
void two() {
int ans=inf;
for (int i=1;i<=n;++i)
up(ans,lam.run(a+i-1,n-i+1));
print(ans);
}
void three() {
int ans=inf,dian=sam.size();
memset(f,0x3f,sizeof f);
f[0][1]=0;
for (int i=1;i<=n;++i) {
f[i][1]=0;
for (int j=1;j<=dian;++j) f[i][j]=f[i-1][j];
for (int j=1;j<=dian;++j) {
up(f[i][sam.t[j][a[i]]],min(f[i-1][sam.t[j][a[i]]],f[i-1][j]+1));
}
}
ans=f[n][0];
print(ans);
}
void four() {
int ans=inf,dian=lam.size();
memset(f,0x3f,sizeof f);
f[0][1]=0;
for (int i=1;i<=n;++i) {
f[i][1]=0;
for (int j=1;j<=dian;++j) f[i][j]=f[i-1][j];
for (int j=1;j<=dian;++j) {
up(f[i][lam.t[j][a[i]]],min(f[i-1][lam.t[j][a[i]]],f[i-1][j]+1));
}
}
ans=f[n][0];
print(ans);
}
int main() {
#ifndef ONLINE_JUDGE
freopen("test.in","r",stdin);
freopen("my.out","w",stdout);
#endif
n=read(a);
m=read(b);
sam.build(b,m);
lam.build(b,m);
one();
two();
three();
four();
return 0;
}
bzoj4032-最短不公共子串的更多相关文章
- 【BZOJ4032】[HEOI2015]最短不公共子串(后缀自动机,序列自动机)
[BZOJ4032][HEOI2015]最短不公共子串(后缀自动机,序列自动机) 题面 BZOJ 洛谷 题解 数据范围很小,直接暴力构建后缀自动机和序列自动机,然后直接在两个自动机上进行\(bfs\) ...
- bzoj4032/luoguP4112 [HEOI2015]最短不公共子串(后缀自动机+序列自动机上dp)
bzoj4032/luoguP4112 [HEOI2015]最短不公共子串(后缀自动机+序列自动机上dp) bzoj Luogu 题解时间 给两个小写字母串 $ A $ , $ B $ ,请你计算: ...
- bzoj4032: [HEOI2015]最短不公共子串(SAM+DP)
4032: [HEOI2015]最短不公共子串 题目:传送门 题解: 陈年老题良心%你赛膜爆嘎爷 当初做题...一眼SAM...结果只会两种直接DP的情况... 情况1: 直接设f[i][j] 表示的 ...
- BZOJ 4032: [HEOI2015]最短不公共子串
4032: [HEOI2015]最短不公共子串 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 446 Solved: 224[Submit][Sta ...
- 洛谷 P4112 [HEOI2015]最短不公共子串 解题报告
P4112 [HEOI2015]最短不公共子串 题目描述 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的"子串"指的是它的连续的一段,例如bcd是 ...
- BZOJ 4032: [HEOI2015]最短不公共子串 后缀自动机 暴力
4032: [HEOI2015]最短不公共子串 题目连接: http://www.lydsy.com/JudgeOnline/problem.php?id=4032 Description 在虐各种最 ...
- luoguP4112 [HEOI2015]最短不公共子串 SAM,序列自动机,广搜BFS
luoguP4112 [HEOI2015]最短不公共子串 链接 luogu loj 思路 子串可以用后缀自动机,子序列可以用序列自动机. 序列自动机是啥,就是能访问到所有子序列的自动机. 每个点记录下 ...
- BZOJ4032[HEOI2015]最短不公共子串——序列自动机+后缀自动机+DP+贪心
题目描述 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是. 一个串的“子序列”指的是它的可以 ...
- BZOJ4032:[HEOI2015]最短不公共子串(SAM)
Description 在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之. 一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是. 一个串的“子序列” ...
- [BZOJ4032][HEOI2015]最短不公共子串(Trie+DP)
在虐各种最长公共子串.子序列的题虐的不耐烦了之后,你决定反其道而行之——被它们虐. 操作一:对A,B分别建SAM,暴力BFS. 操作二:对B建序列自动机或SAM,A在上面暴力匹配. 操作三:对A,B建 ...
随机推荐
- 20155322 2016-2017-2 《Java程序设计》实验二《Java面向对象程序设计》
20155322 2016-2017-2 <Java程序设计>实验二<Java面向对象程序设计> 实验目的与内容 初步掌握单元测试和TDD 理解并掌握面向对象三要素:封装.继承 ...
- #2017-2018-1 20155327 《信息安全系统设计基础》实现mypwd
2017-2018-1 20155327 <信息安全系统设计基础>实现mypwd Linux pwd命令用于显示工作目录. 执行pwd指令可立刻得知您目前所在的工作目录的绝对路径名称. p ...
- IAR里面STM32工程使用printf
1. 首先打开工程的options设置 2. 设置编译器的预宏定义,添加宏定义_DLIB_FILE_DESCRIPTOR 3. 修改文件DLib_Defaults.h DLib_Defaults.h ...
- django项目的配置文件settings.py详解
我们创建好了一个Python项目(mysite/)之后,需要在项目中添加模块应用(polls/),在模块应用中添加处理功能逻辑,如添加模块中的视图处理函数(polls.views.index()),这 ...
- Vue 数组封装和组件data定义为函数一些猜测
数组封装 var vm={ list:[0,1] } var push=vm.list.push;//把数组原来的方法存起来 vm.list.push=function(arg){//重新定义数组的 ...
- dotweb now released to Version 1.5
dotweb released to Version 1.5!!https://github.com/devfeel/dotweb What's new? 重要:go版本适配升级为1.9+ New f ...
- Django之视图系统
Django的View(视图) 一个视图函数(类),简称视图,是一个简单的python函数(类),它接受web请求并返回web响应. 响应可以是一张网页的HTML内容,一个重定向,一个404错误,或者 ...
- 04-JVM内存模型:直接内存
1.1.什么是直接内存(Derect Memory) 在内存模型最开始的章节中,我们画出了JVM的内存模型,里面并不包含直接内存,也就是说这块内存区域并不是JVM运行时数据区的一部分,但它却会被频繁的 ...
- Excel小技巧整理(持续更新)
合并某列中相同单元格 参考https://jingyan.baidu.com/article/9158e00006db70a25512286f.html 使用方法 先给需要合并的列排序,这样相同数据会 ...
- java list根据id获取子节点
工作中因业务需求,将数据库中的树状结构的数据根据父节点获取所有的子节点 实现思路 1.获取整个数据的list集合数据 2.将数据分组,java8 list有groupby分组,java8之前的自己遍历 ...