Note -「Suffix Automaton」SAM
Part. 1 基本信息
Part. 1-1 SAM 的构成。
SAM 由两个东西构成,一个是一个 DAWG,还有一棵外向树,叫 parent tree。
比如,给你一个字符串 \(S=\sf abbabb\),它的 SAM 长成这样:

SAM 的 DAWG 大概可以理解为把字符串的所有后缀插入一个 Trie。当然如果你暴力插,点数为 \(\mathcal{O}(n^2)\)。
不过显然我们可以把一些重复的结点 rua 在一起,点数差不多就成了 \(\mathcal{O}(n)\),还要带个 \(2\) 的常数。
然后,\(S\) 的子串都可以被 SAM 的 DAWG 上的某条路径表示,很显,对吧。
DAWG 的边就是上图中的黑边,蓝边就是 parent tree 的树边。
Part. 1-2 符号约定
我们称 \(S[l,r]\) 为字符串 \(S\) 的 \([l,r]\) 的子串,相信大家都懂,下标从 \(1\) 开始。
我们称一个集合 \(\text{endpos}(S[l,r])\) 为:对于字符串 \(S\),\(S[l,r]\) 在 \(S\) 中出现的区间为 \([l_{1},r_{1}],\cdots,[l_{k},r_{k}]\),\(\text{endpos}(S[l,r])=\{r_{1},\cdots,r_{k}\}\)。
对于两个子串 \(x,y\),如果 \(\text{endpos}(x)=\text{endpos}(y)\),则称 \(x,y\) 在同一个 \(\text{endpos}\) 等价类中。
显然在 DAWG 上,从根节点到一个结点 \(u\) 能组成的字符串的长度是不同的(不同的路径组成的字符串长度不一定等),我们称从根节点到一个结点 \(u\) 能组成的最长的一个字符串的长度为 \(\text{maxlen}(u)\),最短的称为 \(\text{minlen}(u)\)。
Part. 2 需要知道的
Part. 2-1 \(\text{enspos}\) 的性质
引理 1:对于两个 \(S\) 的非空子串 \(x,y\)(不妨设 \(|x|<|y|\)),若 \(\text{endpos}(x)=\text{endpos}(y)\),则 \(x\) 为 \(y\) 的一个真后缀。
Obviously。
引理 2:对于两个 \(S\) 的非空子串 \(x,y\)(不妨设 \(|x|\le|y|\)),则
\[\begin{cases}
\text{endpos}(x)\subseteq\text{endpos}(y),x\text{ is a suffix of } y, \\
\displaystyle\\
\text{endpos}(x)\cap\text{endpos}(y),\text{otherwise}
\end{cases}
\]
Obviously。
引理 3:在一个 \(\text{endpos}\) 等价类中,将类中的所有子串按长度非递增的顺序排序。每个子串都不会比它前一个子串长,与此同时每个子串也是它前一个子串的后缀。换句话说,对于同一等价类的任一两子串,较短者为较长者的后缀,且该等价类中的子串长度恰好覆盖整个区间 \([x,y]\)。
由引理 1,可知这些子串不会等长(对于两个串,较短串为较长串的真后缀),后面 obviously。
说得简单一点,把一个等价类里面最长的那个字符串拿出来,其他所有串都是该串的 suffix。
Part. 2-2 后缀链接 Link
后缀链接是在原串的 DAWG 上的点连出的边。后缀链接的链接遵循某种规则,且最后构成的是一棵树,我们把后缀链接连出来的树称为 Parent Tree,在后文我们将讲解这种规则。
我们先来看看一个串 \(S=\sf aababa\) 的 Parent Tree 长成副什么样子:

图是从 command_block 那里拿来的,可以沟通删除。(已经修正了原图的勘误)
为了说明方便,我们以一个任意的等价类来说明,我们称这个等价类中长度最大的串为 \(S_{\max}\),同理有 \(S_{\min}\)。
考虑在 \(S_{\max}\) 前面加上一个字符,称为新串为 \(S_{\text{new}}\),显然 \(S_{\text{new}}\) 一定不和 \(S_{\max}\) 在同一等价类里。
我们把上述 加字符 的操作看为分裂出儿子。有了这些,我们可以得出一些性质:
设 Parent Tree 上的父亲为 \(f\),儿子为 \(u\),有 \(\text{minlen}(u)=\text{maxlen}(f)+1\),显然。
点数边数皆为 \(\mathcal{O}(n)\),不考虑证明,背着。
在 Parent Tree 上,一个结点的父亲一定是该结点的后缀,显然。
最后板子自己理解性背住吧,构造方法不想写了。
struct SuffixAutomaton
{
int ID(char c)
{
return c-'a';
}
struct node
{
int len,link,ch[26];
}nodes[3000010];
int n,cntot,las,siz[3000010];
char s[1000010];
vector<int> e[3000010];
void init(int len,char c[])
{
n=len;
for(int i=1;i<=n;++i) s[i]=c[i];
nodes[0].len=las=cntot=0;
nodes[0].link=-1;
}
void extend(char c)
{
int cur=++cntot,one=las,ano=0;
nodes[cur].len=nodes[las].len+1;
while(~one&&!nodes[one].ch[ID(c)])
{
nodes[one].ch[ID(c)]=cur;
one=nodes[one].link;
}
if(one==-1) nodes[cur].link=0;
else
{
ano=nodes[one].ch[ID(c)];
if(nodes[one].len+1==nodes[ano].len) nodes[cur].link=ano;
else
{
int clone=++cntot;
nodes[clone].len=nodes[one].len+1;
nodes[clone].link=nodes[ano].link;
memcpy(nodes[clone].ch,nodes[ano].ch,sizeof(int)*26);
while(~one&&nodes[one].ch[ID(c)]==ano)
{
nodes[one].ch[ID(c)]=clone;
one=nodes[one].link;
}
nodes[ano].link=nodes[cur].link=clone;
}
}
siz[las=cur]=1;
}
void pre()
{
for(int i=1;i<=n;++i) extend(s[i]);
for(int i=1;i<=cntot;++i) e[nodes[i].link].push_back(i);
}
void dfs(int x)
{
for(int i=0;i<e[x].size();++i)
{
int y=e[x][i];
dfs(y);
siz[x]+=siz[y];
}
if(siz[x]^1) ans=max(ans,siz[x]*nodes[x].len);
}
}SAM;
代码中的 siz 是 \(\text{endpos}\) 集合大小。
Note -「Suffix Automaton」SAM的更多相关文章
- Note -「Lagrange 插值」学习笔记
目录 问题引入 思考 Lagrange 插值法 插值过程 代码实现 实际应用 「洛谷 P4781」「模板」拉格朗日插值 「洛谷 P4463」calc 题意简述 数据规模 Solution Step 1 ...
- Note -「动态 DP」学习笔记
目录 「CF 750E」New Year and Old Subsequence 「洛谷 P4719」「模板」"动态 DP" & 动态树分治 「洛谷 P6021」洪水 「S ...
- Note -「单位根反演」学习笔记
\(\mathcal{Preface}\) 单位根反演,顾名思义就是用单位根变换一类式子的形式.有关单位根的基本概念可见我的这篇博客. \(\mathcal{Formula}\) 单位根反演的 ...
- Note -「Mobius 反演」光速入门
目录 Preface 数论函数 积性函数 Dirichlet 卷积 Dirichlet 卷积中的特殊函数 Mobius 函数 & Mobius 反演 Mobius 函数 Mobius 反演 基 ...
- Note -「Min_25 筛」“你就说这素因子你要不要吧?你要不要?”
赛上想写,Track Lost 了属于是. \(\mathscr{Intro}\) Min_25 筛是用于求积性函数前缀和,同时顺带求出一些"有意思"的信息的筛法. 一 ...
- Note -「多项式」基础模板(FFT/NTT/多模 NTT)光速入门
进阶篇戳这里. 目录 何为「多项式」 基本概念 系数表示法 & 点值表示法 傅里叶(Fourier)变换 概述 前置知识 - 复数 单位根 快速傅里叶正变换(FFT) 快速傅里叶逆变换(I ...
- Note -「圆方树」学习笔记
目录 圆方树的定义 圆方树的构造 实现 细节 圆方树的运用 「BZOJ 3331」压力 「洛谷 P4320」道路相遇 「APIO 2018」「洛谷 P4630」铁人两项 「CF 487E」Touris ...
- Note -「Dijkstra 求解 MCMF」
食用前请先了解 SPFA + Dinic/EK 求解 MCMF. Sol. 总所周知,SPFA 牺牲了.于是我们寻求一些更稳定的算法求解 MCMF. 网络流算法的时间属于玄学,暂且判定为混乱中的稳定. ...
- 「TJOI / HEOI2016」字符串
「TJOI / HEOI2016」字符串 题目描述 佳媛姐姐过生日的时候,她的小伙伴从某东上买了一个生日礼物.生日礼物放在一个神奇的箱子中.箱子外边写了一个长为 \(n\) 的字符串 \(s\),和 ...
- [转帖]「日常小记」linux中强大且常用命令:find、grep
「日常小记」linux中强大且常用命令:find.grep https://zhuanlan.zhihu.com/p/74379265 在linux下面工作,有些命令能够大大提高效率.本文就向大家介绍 ...
随机推荐
- 预测 motif 的计算原理
本文章来源于简书,作者小潤澤,已获原作者授权:部分内容有调整. 前言 蛋白质中功能的基本单元是 domain,是一种特殊的三维结构,不同结构的 domain 与其他分子特异性结合从而发挥功能.与此类似 ...
- 文档在线预览(四)将word、txt、ppt、excel、图片转成pdf来实现在线预览
@ 目录 事前准备 1.需要的maven依赖 2.后面用到的工具类代码: 一.word文件转pdf文件(支持doc.docx) 二.txt文件转pdf文件 三.PPT文件转pdf文件(支持ppt.pp ...
- 抓包分析RST报文
大家好,我是蓝胖子,今天我们来分析下网络连接中经常出现的RST信号,连接中出现RST信号意味着这条链接将会断开,来看下什么时候会触发RST信号,这在分析连接断开的原因时十分有帮助. 本文的讲解视频已经 ...
- 创建springboot工程失败解决 spring initializr Error:cannot download
创建springboot工程失败解决 问题描述 原因分析: 网络不好,因为springBooT项目的创建时必须联网的 解决方案: 方案一: 将创建 springBoot 工程的地址更换为如下的地址 阿 ...
- 【C#/.NET】RESTful风格的Post请求与CreateAtAction
目录 引言 实现步骤 概念介绍 创建控制器 总结 引言 在构建Web应用程序时,遵循RESTful风格的API设计原则能够使我们的系统更加灵活.可扩展和易于维护.其中,Post请求在创建资源时起 ...
- 2023-07-05:爱丽丝和鲍勃继续他们的石子游戏 许多堆石子 排成一行,每堆都有正整数颗石子 piles[i] 游戏以谁手中的石子最多来决出胜负。 爱丽丝和鲍勃轮流进行,爱丽丝先开始。最初,
2023-07-05:爱丽丝和鲍勃继续他们的石子游戏 许多堆石子 排成一行,每堆都有正整数颗石子 piles[i] 游戏以谁手中的石子最多来决出胜负. 爱丽丝和鲍勃轮流进行,爱丽丝先开始.最初,M = ...
- JDBC的增删改-结果集的元数据-Class反射-JDBC查询封装
一.使用JDBC批量添加 知识点复习: 1.JDBC的六大步骤 (导入jar包, 加载驱动类,获取连接对象, 获取sql执行器.执行sql与并返回结果, 关闭数据库连接) 2.封装了一个DBU ...
- 学习jQuery核心内容这一篇就够了
jQuery 1. 介绍 jQuery是JavaScript的工具库,对原生JavaScript中的DOM操作.事件处理.数据处理等进行封装,提供更便捷的方法. 让我们用更少的代码完成我们的js操作 ...
- 从0开发WebGPU渲染引擎:实现路径追踪
大家好,本文基于WebGPU的计算着色器实现了基础的路径追踪器,支持Middle BVH和No BVH两种加速结构 我主要是将离线渲染零基础实战开发培训班(一期)->第二十九节课的代码移植到We ...
- 【Spring】@RequestBody的实现原理
@RequestBody注解可以用于POST请求接收请求体中的参数,使用方式如下: @Controller public class IndexController { @PostMapping(va ...