题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4622

题意:给定一个长度不超过2000的字符串,之后有Q次区间查询(Q <= 10000),问区间中不同的子串数为多少?

学习资料: 知乎

SAM解析:

看了clj的PPT,对于最后为什么这样子插入节点还是有些不懂... 下面先讲讲一些理解

1.找出母串A中的所有子串可以看做是先找出A串的所有后缀,再在后缀中找出前缀(后缀中找前缀);其中的init(初始状态)是指可以匹配所有后缀的原始状态,即可以对每个后缀进行trans(init,suf)到end状态,不要想着从A串开头进行匹配;

2.一个状态s由所有Right集合是Right(s)的字符串组成

Right集合相同只能说明串之间构成包含关系,如a,b子串的Right集合相同,并且max(a) < min(b)只能说明a是b串的后缀。

注:其中的max、min表示的是在母串中出现的结束位置所构成的集合为Right时的字符串(不止一个)的长度的最大/小值;

3.在构造后缀自动机时,step表示该字符所在的后缀的下标,即每次在前一个字符的基础之上+1.并且由于前一字符的Right集合中包含L+1,但是要使得状态能够通过字符为ch的边转移还需要g[][v]不等于0,这时就需要回溯到某一个g[][v] != 0的祖先节点。

注:祖先节点的Right包含后代节点,因为祖先节点表示的路径是后代节点路径的后缀,出现的位置更多;

4.step表示的含义?以及为何插入查找的原理?

令当前还未插入的状态为trans(init,T),其中T表示A[1...L-1],当前待插入的字符x为A[L],其中step[x] = L+1,(step表示字符x是当前要建的后缀自动机字符串的第几个)之后在Right集合含有L的状态中查找第一个可通过边x转移的状态p,

如果不考虑子串是否相同,则Tx的后缀数量为step[x],由于是按照pre向上查找的,所以当找到p时,我们需要知道以p为后缀的子串有多少也是以x为后缀的?

这时候就用到了“压缩”,因为p的父节点们都符合条件(父节点的Right[L] = x,都是Tx的后缀),只需要压缩q和q的父节点p的空隙(step之间的差值为1),即可知道在状态为Tx时,有多少Tx的后缀已经存在~~,这时相减即可知道新添加的子串数量;

代码参考:JeraKrs

 #include<iostream>
#include<cstdio>
#include<cstring>
using namespace std; #define maxn 2007
#define SIGMA_SIZE 26 struct SAM{
int sz,tot,last;
int g[maxn<<][SIGMA_SIZE],pre[maxn<<],step[maxn<<]; void newNode(int s){
step[++sz] = s;
pre[sz] = ;
memset(g[sz],,sizeof(g[sz]));
} void init(){
tot = ;
sz = ; last = ;
newNode();
} int idx(char ch){return ch - 'a';} int Insert(char ch){
newNode(step[last]+);
int v = idx(ch), p = last, np = sz; while(p && !g[p][v])
g[p][v] = np,p = pre[p]; //知道找到Right集合中包含x的边的祖宗节点 if(p){
int q = g[p][v];
if(step[q] == step[p] + )
pre[np] = q;
else{
newNode(step[p]+);
int nq = sz; //nq替换掉q节点
for(int i = ;i < SIGMA_SIZE;i++)
g[nq][i] = g[q][i]; pre[nq] = pre[q];
pre[np] = pre[q] = nq; while(p && g[p][v] == q)
g[p][v] = nq,p = pre[p];
}
}
else pre[np] = ; tot += step[np] - step[pre[np]];
last = np;
return tot;
}
}SA;
char str[maxn];
int ans[maxn][maxn];
int main()
{
int T;
scanf("%d",&T);
while(T--){
scanf("%s",str);
int len = strlen(str);
for(int i = ;i < len;i++){
SA.init();
for(int j = i;j < len;j++){
ans[i][j] = SA.Insert(str[j]);
}
}
int Q, l, r;
scanf("%d",&Q);
while(Q--){
scanf("%d%d",&l,&r);
printf("%d\n",ans[--l][--r]);
}
}
}

hdu 4622 Reincarnation SAM模板题的更多相关文章

  1. HDU 4622 Reincarnation Hash解法详解

    今天想学字符串hash是怎么弄的.就看到了这题模板题 http://acm.hdu.edu.cn/showproblem.php?pid=4622 刚开始当然不懂啦,然后就上网搜解法.很多都是什么后缀 ...

  2. hdu 4622 Reincarnation(后缀数组)

    hdu 4622 Reincarnation 题意:还是比较容易理解,给出一个字符串,最长2000,q个询问,每次询问[l,r]区间内有多少个不同的字串. (为了与论文解释统一,这里解题思路里sa数组 ...

  3. HDU 2222 AC自动机模板题

    题目: http://acm.hdu.edu.cn/showproblem.php?pid=2222 AC自动机模板题 我现在对AC自动机的理解还一般,就贴一下我参考学习的两篇博客的链接: http: ...

  4. HDU 1251 Trie树模板题

    1.HDU 1251 统计难题  Trie树模板题,或者map 2.总结:用C++过了,G++就爆内存.. 题意:查找给定前缀的单词数量. #include<iostream> #incl ...

  5. HDU 3065 (AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3065 题目大意:多个模式串,范围是大写字母.匹配串的字符范围是(0~127).问匹配串中含有哪几种模 ...

  6. HDU 2896 (AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2896 题目大意:多个模式串.多个匹配串.其中串的字符范围是(0~127).问匹配串中含有哪几个模式串 ...

  7. HDU 4622 Reincarnation 后缀自动机

    模板来源:http://blog.csdn.net/zkfzkfzkfzkfzkfzkfzk/article/details/9669747 解法参考:http://blog.csdn.net/dyx ...

  8. hdu 1711 KMP算法模板题

    题意:给你两个串,问你第二个串是从第一个串的什么位置開始全然匹配的? kmp裸题,复杂度O(n+m). 当一个字符串以0为起始下标时.next[i]能够描写叙述为"不为自身的最大首尾反复子串 ...

  9. HDU 2544 最短路(模板题)

    求1到N的最短路径,模板题,以1为源点,用dijkstra算法(可以用优先级队列优化) #include <iostream> #include <algorithm> #in ...

随机推荐

  1. Uva120 Stacks of Flapjacks 翻煎饼

    水水题.给出煎饼数列, 一次只能让第一个到第i个数列全部反转,要求把数列排序为升序. 算法点破后不值几钱... 只要想办法把最大的煎饼放到最后一个,然后就变成前面那些煎饼的数列的子题目了.递归或循环即 ...

  2. VMware系统运维(三 )SQL Server 2008 R2安装

    1. 点击"全新SQL Server 独立安装或向现有安装添加功能" 2.验证通过,点击确定. 3.输入数据库密钥,必须支持正版,不然微软打你屁屁,嘻嘻 4.不接受不让你过,所以不 ...

  3. Telnet客户端连接服务器,看不见字符,只显示横线

    Telnet 窗口看不见字符,只显示小横线 在用telnet连接tomcat服务器的 时候,窗口中不显示字符,显示成一个一个的横线 解决办法: 按住“Ctrl+]” 回车解决问题

  4. 关于修改Eclipse工作空间对应的文件夹名称之后的处理.

    把文件夹名字从"xhkong"变成"xhkong(maintenance5.6)"之后打开这个工作空间. 导入git仓库我发现了一个之前没有发现的小技巧. 导入 ...

  5. poj 1679 次小生成树

    次小生成树的求法: 1.Prime法 定义一个二维数组F[i][j]表示点i到点j在最小生成树中的路径上的最大权值.有个知识就是将一条不在最小生成树中的边Edge加入最小生成树时,树中要去掉的边就是E ...

  6. IIS服务器应用程序不可用的解决办法

    转载:http://www.cnblogs.com/caicainiao/archive/2010/11/29/1891085.html 这个问题见了好几次,在.net下 Microsoft visu ...

  7. .net 下载图片

    最近boss让写一个二维码的生成器,但是二维码生成后用户如果想下载二维码,这就促使我写l了 下载功能,小弟自认为技术不咋样,是个彻头彻尾的码农,本先是想用js来实现功能,但是查找了好多资料也没能实现, ...

  8. (转)使用Aspose.Cell控件实现Excel高难度报表的生成(一)

    本文章主要介绍报表的生成,基于Aspose.Cell控件的报表生成.谈到报表,估计大家都有所领悟以及个人的理解,总的来说,一般的报表生成,基本上是基于以下几种方式:一种是基于微软Excel内置的引擎来 ...

  9. CSS的继承与优先级

    CSS样式继承性 body,div,p{} html文档可以上图的种种节点树的形式表示,css层叠样式表中的各元素也有这种对应关系 <body>是文档中最大的根节点,body中的所有元素都 ...

  10. 09_Java8操作集合的一些新特性

    [使用forEach()结合Lambda表达式遍历集合] public class ForEachDemo { public static void main(String[] args) { Col ...