SAM求多个串的最长公共子串
又学到一个\(SAM\)的新套路QvQ
思路
考虑用其中的一个串建个\(SAM\),然后用其他的串在上面匹配,匹配时更新答案
首先有一个全局变量\(len\),表示当前已匹配的长度。假设目前在点\(u\),转移方式如下(根节点为\(1\)):
如果没有对应的转移边,就走后缀连接,\(u=suflink(u)\),并令\(len=maxlen(suflink(u))\)。否则走对应的转移边,同时\(len++\)。如果一直没有对应的转移边,即到最后发现\(u=0\),就把\(u\)置为\(1\),\(len\)置为\(0\),并开始下个字符的匹配
开一个数组\(mx\)记录每个结点被匹配时的\(len\)最大是多少,全部匹配完后还要拓扑排序一遍,把每个结点的\(mx\)上传给其\(parent\ tree\)上的祖先。对于一个结点\(u\),它所代表的\(lcs\)长度为每个字符串匹配完后\(mx\)中的最小值,每次更新一下就行了
代码
#include <bits/stdc++.h>
using namespace std;
#define N 100000
int m, n, root = 1, nid = 1, last = 1, maxlen[2*N+5], ch[2*N+5][26], link[2*N+5], mx[2*N+5], mn[2*N+5], len;
int tmp[2*N+5], a[2*N+5];
void insert(int c) {
int cur = ++nid;
maxlen[cur] = maxlen[last]+1;
while(last && !ch[last][c]) ch[last][c] = cur, last = link[last];
if(!last) link[cur] = root;
else {
int p = last, q = ch[last][c];
if(maxlen[q] == maxlen[p]+1) link[cur] = q;
else {
int clone = ++nid;
maxlen[clone] = maxlen[p]+1;
for(int i = 0; i < 26; ++i) ch[clone][i] = ch[q][i];
link[clone] = link[q]; link[q] = link[cur] = clone;
while(p && ch[p][c] == q) ch[p][c] = clone, p = link[p];
}
}
last = cur;
}
void radixSort() {
memset(tmp, 0, sizeof tmp);
for(int i = 1; i <= nid; ++i) tmp[maxlen[i]]++;
for(int i = 1; i <= m; ++i) tmp[i] += tmp[i-1];
for(int i = 1; i <= nid; ++i) a[tmp[maxlen[i]]--] = i;
for(int i = nid; i >= 1; --i)
mx[link[a[i]]] = max(mx[link[a[i]]], min(maxlen[link[a[i]]], mx[a[i]])), mn[a[i]] = min(mn[a[i]], mx[a[i]]);
}
void calc(char *s) {
n = strlen(s);
memset(mx, 0, sizeof mx);
int u = root;
len = 0;
for(int i = 0; i < n; ++i) {
while(u && !ch[u][s[i]-'a']) u = link[u], len = maxlen[u];
if(!u) u = root;
else {
u = ch[u][s[i]-'a'];
len++;
mx[u] = max(mx[u], len);
}
}
radixSort();
}
int main() {
char s[N+5];
scanf("%s", s);
m = strlen(s);
for(int i = 0; i < m; ++i) insert(s[i]-'a');
memset(mn, 0x3f, sizeof mn);
while(~scanf("%s", s)) calc(s);
int ans = 0;
for(int i = 1; i <= nid; ++i) ans = max(ans, mn[i]);
printf("%d\n", ans);
return 0;
}
例题
SP1811
SP1812
SP10570
[SDOI2008]Sandy的卡片
SAM求多个串的最长公共子串的更多相关文章
- SPOJ 1811 Longest Common Substring(求两个串的最长公共子串 || 或者n个串)
http://www.spoj.com/problems/LCS/ 题目:求两个串的最长公共子串 参考:https://www.cnblogs.com/autoint/p/10345276.html: ...
- SPOJ 1811 Longest Common Substring (后缀自动机第一题,求两个串的最长公共子串)
题目大意: 给出两个长度小于等于25W的字符串,求它们的最长公共子串. 题目链接:http://www.spoj.com/problems/LCS/ 算法讨论: 二分+哈希, 后缀数组, 后缀自动机. ...
- 多个串的最长公共子串 SPOJ - LCS2 后缀自动机
题意: 求多个串的最长公共子串 这里用的是O(n)的后缀自动机写法 我后缀数组的专题有nlog(n)写法的 题解: 对于其中的一个串建立后缀自动机 然后对于后缀自动机上面的每一个节点求出每一个节点最长 ...
- 【poj1226-出现或反转后出现在每个串的最长公共子串】后缀数组
题意:求n个串的最长公共子串,子串出现在一个串中可以是它的反转串出现.总长<=10^4. 题解: 对于每个串,把反转串也连进去.二分长度,分组,判断每个组. #include<cstdio ...
- SPOJ LCS2 多个串的最长公共子串
这里串最多有10个,找所有串的最长公共子串 这里后缀自动机做,以第一个串建立后缀自动机,后面的串一个个去匹配,每次得到当前串在可到达状态上所能得到的最长后缀长度 拿所有串匹配后得到的结果进行计算 #i ...
- 求两个字符串的最长公共子串——Java实现
要求:求两个字符串的最长公共子串,如“abcdefg”和“adefgwgeweg”的最长公共子串为“defg”(子串必须是连续的) public class Main03{ // 求解两个字符号的最长 ...
- [URAL-1517][求两个字符串的最长公共子串]
Freedom of Choice URAL - 1517 Background Before Albanian people could bear with the freedom of speec ...
- POJ 2774 求两个串的最长公共前缀 | 后缀数组
#include<cstdio> #include<algorithm> #include<cstring> #define N 200005 using name ...
- [SPOJ1812]Longest Common Substring II 后缀自动机 多个串的最长公共子串
题目链接:http://www.spoj.com/problems/LCS2/ 其实两个串的LCS会了,多个串的LCS也就差不多了. 我们先用一个串建立后缀自动机,然后其它的串在上面跑.跑的时候算出每 ...
随机推荐
- 程序员50题(JS版本)(九)
程序41:八进制转换为十进制 var num1=425; var num2=0; num1=num1.toString(); for(var i=num1.length-1,root=1;i>= ...
- Web前端2019面试总结
基础知识点 1.水平垂直居中 子绝父相,子盒子设置绝对定位,设置top:50%;left:50%,margin-top:-50%;margin-left:-50%; 子绝父相,子盒子设置绝对定位, ...
- 前端入门21-JavaScript的ES6新特性
声明 本篇内容全部摘自阮一峰的:ECMAScript 6 入门 阮一峰的这本书,我个人觉得写得挺好的,不管是描述方面,还是例子,都讲得挺通俗易懂,每个新特性基本都还会跟 ES5 旧标准做比较,说明为什 ...
- DVWA 黑客攻防演练(十)反射型 XSS 攻击 Reflected Cross Site Scripting
XSS (Cross-site scripting) 攻击,为和 CSS 有所区分,所以叫 XSS.又是一种防不胜防的攻击,应该算是一种 "HTML注入攻击",原本开发者想的是显示 ...
- mysql基本操作(1)
1.mysql数据库客户端安装 brew install mysql-client 2.mysql 连接数据库 mysql -h <数据库地址> -P <端口> -u < ...
- JVM内存结构简单认知
关于JVM的面试传送门:https://blog.csdn.net/shengmingqijiquan/article/details/77508471 JVM内存结构主要划分为:堆,jvm栈,本地方 ...
- 无法创建保存文件 "afiedt.buf"
我习惯在搜索框输入sqlplus,输入相应的sql语句.但是直接输入ed的时候会报这个错误. 在cmd中登录进去,然后一步一步走,登录进去就可以了. 找到了这两个窗口的一个区别.
- Java获取Linux和Window系统CPU、内存和磁盘总使用率的情况
这是一个工具类,获取的内容: CPU使用率:得到的是当前CPU的使用情况,这是算出的是两次500毫秒时间差的CPU使用率 内存使用率:[1 - 剩余的物理内存/(总的物理内存+虚拟内存) ] * 1 ...
- Python--day10(函数(使用、分类、返回值))
1. 函数 1. 函数: 完成特定功能的代码块,作为一个整体,对其进行特定的命名,该名字就代表这函数 现实中:很多问题要通过一些工具进行处理 => 可以将工具提前生产出来并命名 =>通 ...
- day13(函数嵌套定义,global,nonlocal关键字,闭包,装饰器)
一,复习 ''' 1.函数对象:函数名 => 存放的是函数的内存地址 1)函数名 - 找到的是函数的内存地址 2)函数名() - 调用函数 => 函数的返回值 eg:fn()() => ...