hdu 4622 Reincarnation SAM模板题
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4622
题意:给定一个长度不超过2000的字符串,之后有Q次区间查询(Q <= 10000),问区间中不同的子串数为多少?
学习资料: 知乎
SAM解析:
看了clj的PPT,对于最后为什么这样子插入节点还是有些不懂... 下面先讲讲一些理解
1.找出母串A中的所有子串可以看做是先找出A串的所有后缀,再在后缀中找出前缀(后缀中找前缀);其中的init(初始状态)是指可以匹配所有后缀的原始状态,即可以对每个后缀进行trans(init,suf)到end状态,不要想着从A串开头进行匹配;
2.一个状态s由所有Right集合是Right(s)的字符串组成
Right集合相同只能说明串之间构成包含关系,如a,b子串的Right集合相同,并且max(a) < min(b)只能说明a是b串的后缀。
注:其中的max、min表示的是在母串中出现的结束位置所构成的集合为Right时的字符串(不止一个)的长度的最大/小值;
3.在构造后缀自动机时,step表示该字符所在的后缀的下标,即每次在前一个字符的基础之上+1.并且由于前一字符的Right集合中包含L+1,但是要使得状态能够通过字符为ch的边转移还需要g[][v]不等于0,这时就需要回溯到某一个g[][v] != 0的祖先节点。
注:祖先节点的Right包含后代节点,因为祖先节点表示的路径是后代节点路径的后缀,出现的位置更多;
4.step表示的含义?以及为何插入查找的原理?
令当前还未插入的状态为trans(init,T),其中T表示A[1...L-1],当前待插入的字符x为A[L],其中step[x] = L+1,(step表示字符x是当前要建的后缀自动机字符串的第几个)之后在Right集合含有L的状态中查找第一个可通过边x转移的状态p,
如果不考虑子串是否相同,则Tx的后缀数量为step[x],由于是按照pre向上查找的,所以当找到p时,我们需要知道以p为后缀的子串有多少也是以x为后缀的?
这时候就用到了“压缩”,因为p的父节点们都符合条件(父节点的Right[L] = x,都是Tx的后缀),只需要压缩q和q的父节点p的空隙(step之间的差值为1),即可知道在状态为Tx时,有多少Tx的后缀已经存在~~,这时相减即可知道新添加的子串数量;
代码参考:JeraKrs
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std; #define maxn 2007
#define SIGMA_SIZE 26 struct SAM{
int sz,tot,last;
int g[maxn<<][SIGMA_SIZE],pre[maxn<<],step[maxn<<]; void newNode(int s){
step[++sz] = s;
pre[sz] = ;
memset(g[sz],,sizeof(g[sz]));
} void init(){
tot = ;
sz = ; last = ;
newNode();
} int idx(char ch){return ch - 'a';} int Insert(char ch){
newNode(step[last]+);
int v = idx(ch), p = last, np = sz; while(p && !g[p][v])
g[p][v] = np,p = pre[p]; //知道找到Right集合中包含x的边的祖宗节点 if(p){
int q = g[p][v];
if(step[q] == step[p] + )
pre[np] = q;
else{
newNode(step[p]+);
int nq = sz; //nq替换掉q节点
for(int i = ;i < SIGMA_SIZE;i++)
g[nq][i] = g[q][i]; pre[nq] = pre[q];
pre[np] = pre[q] = nq; while(p && g[p][v] == q)
g[p][v] = nq,p = pre[p];
}
}
else pre[np] = ; tot += step[np] - step[pre[np]];
last = np;
return tot;
}
}SA;
char str[maxn];
int ans[maxn][maxn];
int main()
{
int T;
scanf("%d",&T);
while(T--){
scanf("%s",str);
int len = strlen(str);
for(int i = ;i < len;i++){
SA.init();
for(int j = i;j < len;j++){
ans[i][j] = SA.Insert(str[j]);
}
}
int Q, l, r;
scanf("%d",&Q);
while(Q--){
scanf("%d%d",&l,&r);
printf("%d\n",ans[--l][--r]);
}
}
}
hdu 4622 Reincarnation SAM模板题的更多相关文章
- HDU 4622 Reincarnation Hash解法详解
今天想学字符串hash是怎么弄的.就看到了这题模板题 http://acm.hdu.edu.cn/showproblem.php?pid=4622 刚开始当然不懂啦,然后就上网搜解法.很多都是什么后缀 ...
- hdu 4622 Reincarnation(后缀数组)
hdu 4622 Reincarnation 题意:还是比较容易理解,给出一个字符串,最长2000,q个询问,每次询问[l,r]区间内有多少个不同的字串. (为了与论文解释统一,这里解题思路里sa数组 ...
- HDU 2222 AC自动机模板题
题目: http://acm.hdu.edu.cn/showproblem.php?pid=2222 AC自动机模板题 我现在对AC自动机的理解还一般,就贴一下我参考学习的两篇博客的链接: http: ...
- HDU 1251 Trie树模板题
1.HDU 1251 统计难题 Trie树模板题,或者map 2.总结:用C++过了,G++就爆内存.. 题意:查找给定前缀的单词数量. #include<iostream> #incl ...
- HDU 3065 (AC自动机模板题)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3065 题目大意:多个模式串,范围是大写字母.匹配串的字符范围是(0~127).问匹配串中含有哪几种模 ...
- HDU 2896 (AC自动机模板题)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2896 题目大意:多个模式串.多个匹配串.其中串的字符范围是(0~127).问匹配串中含有哪几个模式串 ...
- HDU 4622 Reincarnation 后缀自动机
模板来源:http://blog.csdn.net/zkfzkfzkfzkfzkfzkfzk/article/details/9669747 解法参考:http://blog.csdn.net/dyx ...
- hdu 1711 KMP算法模板题
题意:给你两个串,问你第二个串是从第一个串的什么位置開始全然匹配的? kmp裸题,复杂度O(n+m). 当一个字符串以0为起始下标时.next[i]能够描写叙述为"不为自身的最大首尾反复子串 ...
- HDU 2544 最短路(模板题)
求1到N的最短路径,模板题,以1为源点,用dijkstra算法(可以用优先级队列优化) #include <iostream> #include <algorithm> #in ...
随机推荐
- Uva120 Stacks of Flapjacks 翻煎饼
水水题.给出煎饼数列, 一次只能让第一个到第i个数列全部反转,要求把数列排序为升序. 算法点破后不值几钱... 只要想办法把最大的煎饼放到最后一个,然后就变成前面那些煎饼的数列的子题目了.递归或循环即 ...
- VMware系统运维(三 )SQL Server 2008 R2安装
1. 点击"全新SQL Server 独立安装或向现有安装添加功能" 2.验证通过,点击确定. 3.输入数据库密钥,必须支持正版,不然微软打你屁屁,嘻嘻 4.不接受不让你过,所以不 ...
- Telnet客户端连接服务器,看不见字符,只显示横线
Telnet 窗口看不见字符,只显示小横线 在用telnet连接tomcat服务器的 时候,窗口中不显示字符,显示成一个一个的横线 解决办法: 按住“Ctrl+]” 回车解决问题
- 关于修改Eclipse工作空间对应的文件夹名称之后的处理.
把文件夹名字从"xhkong"变成"xhkong(maintenance5.6)"之后打开这个工作空间. 导入git仓库我发现了一个之前没有发现的小技巧. 导入 ...
- poj 1679 次小生成树
次小生成树的求法: 1.Prime法 定义一个二维数组F[i][j]表示点i到点j在最小生成树中的路径上的最大权值.有个知识就是将一条不在最小生成树中的边Edge加入最小生成树时,树中要去掉的边就是E ...
- IIS服务器应用程序不可用的解决办法
转载:http://www.cnblogs.com/caicainiao/archive/2010/11/29/1891085.html 这个问题见了好几次,在.net下 Microsoft visu ...
- .net 下载图片
最近boss让写一个二维码的生成器,但是二维码生成后用户如果想下载二维码,这就促使我写l了 下载功能,小弟自认为技术不咋样,是个彻头彻尾的码农,本先是想用js来实现功能,但是查找了好多资料也没能实现, ...
- (转)使用Aspose.Cell控件实现Excel高难度报表的生成(一)
本文章主要介绍报表的生成,基于Aspose.Cell控件的报表生成.谈到报表,估计大家都有所领悟以及个人的理解,总的来说,一般的报表生成,基本上是基于以下几种方式:一种是基于微软Excel内置的引擎来 ...
- CSS的继承与优先级
CSS样式继承性 body,div,p{} html文档可以上图的种种节点树的形式表示,css层叠样式表中的各元素也有这种对应关系 <body>是文档中最大的根节点,body中的所有元素都 ...
- 09_Java8操作集合的一些新特性
[使用forEach()结合Lambda表达式遍历集合] public class ForEachDemo { public static void main(String[] args) { Col ...