HDU4416Good Article Good sentence(后缀自动机)
Assume that all of the sentences came from some articles. ZengXiao Xian intended to pick from Article A. The number of his classmates is n. The i-th classmate picked from Article Bi. Now ZengXiao Xian wants to know how many different sentences she could pick from Article A which don't belong to either of her classmates?Article. To simplify the problem, ZengXiao Xian wants to know how many different strings, which is the substring of string A, but is not substring of either of string Bi. Of course, you will help him, won't you?
For each test data
The first line contains an integer meaning the number of classmates.
The second line is the string A;The next n lines,the ith line input string Bi.
The length of the string A does not exceed 100,000 characters , The sum of total length of all strings Bi does not exceed 100,000, and assume all string consist only lowercase characters 'a' to 'z'.
T中的字符串依次拿去和S的自动机匹配。每次匹配到一个状态,更新这个状态所匹配的最大的长度p,那么这个状态所表示的子串中长度大于p的即为我们要找的。在计算答案的时候,我们还要同时更新目前状态的pre状态的p值,所以要按逆拓扑序计算总答案。
个人照hihocoder的代码写了几条,发现hihocoder的SAM代码的确没有别人的优美啊,所以我决定用别人的风格:
觉得这种代码好的理由:
【结构体】:
1,在写矩阵的时候我习惯把函数写在结构体里,感觉是要方便些。
2,根据不同的题有不同的改变,在结构体里做点改变不容易搞混而出错。
3,事实证明结构体里面的函数运行快一些(我也记不得在哪里看过这个说法了)
【膜拜作者】:
第一次看到Max这样写,很six。
处理的时候:
1,匹配部分和hiho1465是一样的道理。
2,拓扑没有用前面hihocoder的题一样利用入度ind用队列来做,而是用基数排序来得到拓扑序列,殊途同归,但是代码简洁一些。
3,注意start到底是1还是0,各自有不同的临界条件。
感受:多写几遍自动机,感觉还是有点入门了,233......后缀数组失宠了,回头再结合后缀数组分析一遍这些题。
#include<iostream>
#include<cstring>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<string>
using namespace std;
typedef long long ll;
void Min(ll &a,ll b) { if(a>b) a=b; }
void Max(ll &a,ll b) { if(a<b) a=b; }
const int maxn=1e5+;
const int Sigma=;
char S[maxn];
struct SAM{
int len[maxn<<],fa[maxn<<];//len是maxlen;fa是slink;next是trans;
int next[maxn<<][Sigma];
int cnt[maxn<<],b[maxn<<];
ll dp[maxn<<];
int sz,last;
void init(){//start from 1
sz=last=;
len[]=fa[]=;
memset(next[],,sizeof(next[]));
}
void add(int x){//np,nq是新产生的状态;p,q是转移用的变量
int p=last,np=++sz;last=np;
len[np]=len[p]+;
memset(next[np],,sizeof(next[np]));
while(p&&!next[p][x]) next[p][x]=np,p=fa[p];
if(!p) fa[np]=;
else {
int q=next[p][x];
if(len[q]==len[p]+) fa[np]=q;
else{
int nq=++sz;
memcpy(next[nq],next[q],sizeof(next[q]));//nq代替q;p继续接受后面的
fa[nq]=fa[q],fa[np]=fa[q]=nq;
len[nq]=len[p]+;
while(p&&next[p][x]==q) next[p][x]=nq,p=fa[p];
}
}
}
void sort(){
memset(cnt,,sizeof(cnt));
for(int i=;i<=sz;i++) ++cnt[len[i]];//基数排序,得到top序列
for(int i=;i<=sz;i++) cnt[i]+=cnt[i-];
for(int i=;i<=sz;i++) b[cnt[len[i]]--]=i;
}
void solve(int n){
memset(dp,,sizeof(dp));
while(n--){
scanf("%s",S);
int q=,l=;//从start开始匹配自动机
for(char *p=S;*p;++p){
int x=*p-'a';
while(q>&&!next[q][x]) q=fa[q],l=len[q];
if(next[q][x]) q=next[q][x],++l;
Max(dp[q],l);
}
}
ll ans=;
for(int i=sz;i>;i--){
Max(dp[fa[b[i]]],dp[b[i]]);//长到短
Min(dp[fa[b[i]]],len[fa[b[i]]]);//长度加以限制
}
for(int i=;i<=sz;i++){
ll minlen=dp[i];
if(fa[i]) Max(minlen,len[fa[i]]);
ans+=len[i]-minlen;
}
printf("%lld\n",ans);
}
};
SAM sam;
int main()
{
int T,Case=;scanf("%d",&T);
while(T--){
sam.init();
int n;
scanf("%d",&n);
scanf("%s",S);
for(char *p=S;*p;++p) sam.add(*p-'a');//字符串的指针,学到了
sam.sort();
printf("Case %d: ",++Case);
sam.solve(n);
}
return ;
}
HDU4416Good Article Good sentence(后缀自动机)的更多相关文章
- [hdu4416 Good Article Good sentence]后缀自动机SAM
题意:给出串A和串集合B={B1,B2,...,Bn},求串A的所有不同子串中不是B中任一串的子串的数目. 思路:把A和B中所有字符串依次拼接在一起,然后构造后缀自动机,计算每个状态的R集合元素的最大 ...
- BZOJ 4516: [Sdoi2016]生成魔咒 后缀自动机 性质
http://www.lydsy.com/JudgeOnline/problem.php?id=4516 http://blog.csdn.net/doyouseeman/article/detail ...
- Good Article Good sentence HDU - 4416 (后缀自动机)
Good Article Good sentence \[ Time Limit: 3000 ms\quad Memory Limit: 32768 kB \] 题意 给出一个 \(S\) 串,在给出 ...
- Good Article Good sentence HDU - 4416 (后缀数组)
Good Article Good sentence \[ Time Limit: 3000 ms\quad Memory Limit: 32768 kB \] 题意 给出一个 \(S\) 串,在给出 ...
- HDU 4416 (后缀自动机)
HDU 4416 Good Article Good sentence Problem : 给一个串S,和一些串T,询问S中有多少个子串没有在T中出现. Solution :首先对所有的T串建立后缀自 ...
- HDU 4622 Reincarnation 后缀自动机
模板来源:http://blog.csdn.net/zkfzkfzkfzkfzkfzkfzk/article/details/9669747 解法参考:http://blog.csdn.net/dyx ...
- SPOJ NSUBSTR Substrings 后缀自动机
人生第一道后缀自动机,总是值得纪念的嘛.. 后缀自动机学了很久很久,先是看CJL的论文,看懂了很多概念,关于right集,关于pre,关于自动机的术语,关于为什么它是线性的结点,线性的连边.许多铺垫的 ...
- hdu4436-str2int(后缀数组 or 后缀自动机)
题意:给你一堆字符串,仅包含数字'0'到'9'. 例如 101 123 有一个字符串集合S包含输入的N个字符串,和他们的全部字串. 操作字符串很无聊,你决定把它们转化成数字. 你可以把一个字符串转换成 ...
- HDOJ 4416 Good Article Good sentence
题解转自:http://blog.csdn.net/dyx404514/article/details/8807440 2012杭州网络赛的一道题,后缀数组后缀自己主动机都行吧. 题目大意:给一个字符 ...
随机推荐
- LeetCode:整数转罗马数字【12】
LeetCode:整数转罗马数字[12] 题目描述 罗马数字包含以下七种字符: I, V, X, L,C,D 和 M. 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 10 ...
- dataTables的用法
原地址:http://blog.csdn.net/mickey_miki/article/details/8240477 1.DataTables的默认配置 $(document).ready(fun ...
- list列表、tuple元组、range常用方法总结
list 列表(数组),是可迭代对象,列表是可变的所以列表的方法都是在列表本身更改的.里面看可以放各种数据类型的数据,可存储大量数据 连接列表可以使用 + 或 extend() a = [1, 3, ...
- Kattis - pseudoprime 【快速幂】
题意 给出两个数字 P 和 A 当p 不是素数 并且 满足a^p≡a(mod p) 就输出 yes 否则 输出 no 思路 因为 数据范围较大,用快速幂 AC代码 #include <cstdi ...
- eclipse修改项目默认编码为UTF-8
1.windows->Preferences...打开"首选项"对话框,左侧导航树,导航到general->Workspace,右侧 Text file encodin ...
- 20145230《JAVA程序设计》第2周学习总结
20145230 <Java程序设计>第2周学习总结 教材学习内容总结 本周我学习了<JAVA学习笔记>中的第三章内容,让我对JAVA有了进一步的了解.第三章主要是介绍JAVA ...
- Docker 容器监控平台-Weave Scope
官网地址:https://www.weave.works/oss/scope/ 安装 执行如下脚本安装运行 Weave Scope. curl -L git.io/scope -o /usr/loca ...
- Centos7 搭建DNS服务器与原理配置详解
在搭建我们自己DNS服务器之前,先必须了解下DNS服务器的作用和原理. DNS是在互联网上进行域名解析到对应IP地址的服务器,保存互联网上所有的IP与域名的对应信息,然后将我们对网址的访问,解析成IP ...
- 【codevs3031】最富有的人(字典树)
网址:http://codevs.cn/problem/3031/ 这是蒟蒻写的第一道字典树……听说出市选题的神犇要出字符串,于是就赶紧滚去学了学(然而高精度算字符串算法?) 简单来说,字典树就是把一 ...
- CSU 1786 莫队+KDTree
题意 给出n个二维点(2e5) 和 q个询问(1e4) 每个询问给lr 问点l到r间有多少对点的曼哈顿距离<=d 点的坐标<=108 想出了莫队算法 复杂度n^1.5 看起来很科学 但是每 ...