洛谷 P3808 【模板】AC自动机(简单版) 题解
前置知识:
字典树。(会 \(\texttt{KMP}\) 就更好)
显然呢,本题用 字典树 和 \(\texttt{KMP}\) 无法解决问题。
所以我们发明了一个东西: \(\texttt{AC}\) 自动机!
自动AC就算了吧
首先,我们给这些串建字典树。
建完之后,我们求 失配指针 。
这是干嘛的?求完再说。
它表示以 \(i\) 节点为 结尾 的串的 后缀 有最大公共长度的 前缀的 结尾 编号.
可能有点绕,但是字符串匹配算法,一开始就是雾里云里,后来就是拨云见雾。
引用一张洛谷题解上的图吧。
然后,比方说第 \(3\) 层的 \(c\).
首先,以它结尾的后缀有: \(\texttt{c}\),\(\texttt{bc}\),\(\texttt{abc}\).
显然,从根开始的前缀(不含根)找不到 \(\texttt{abc}\).
但是,我们找到了 \(\texttt{bc}\).
所以,就指向了 \(\texttt{bc}\) 中的 结尾 编号的 \(c\) 的位置。
余下同理,读者自行推理。
下面,我们假设这个图的只有每个叶子节点都是一个单词的末尾。那么,假设我们要找在 \(\texttt{abcde}\) 中的次数,一开始 \(ans = 0\).流程为:
首先一路往下,到 \(d\) 之后发现 \(e\) 没了。这时 \(ans \gets ans+1\),即 \(ans = 1\).
这时我们创建一个空的 \(e\). 并且,对每个 \(e\) 也求一下 失配指针 :
然后,你走到了第二叉的“空节点” \(e\).
然后,你发现:由于失配指针的性质, \(e\) 上面这一段肯定在 \(\texttt{abcd}\) 中出现过(因为后缀和前缀匹配,而长度递减),所以也在原串中出现过。
然后, \(ans \gets ans+1\),即 \(ans = 2\).
接着,你又走到第三叉的“空节点” \(e\).
同样的道理,\(ans \gets ans+1\),即 \(ans = 3\).
接着,你发现当前的 \(e\) 指向根,于是迫不及待地走向了根。
然后你发现当前节点编号是 \(0\),结束。
\(ans = 3\),没有一点毛病,不得不承认这个算法很妙。
可是怎么求 \(\texttt{Fail}\) (失配指针) 呢?
显然,如果父亲节点有了失配指针,你只需比较 你自己 和 父亲失配指针的那一位 ,相同则指过去,不然呢就指根。
这是因为,父亲节点以上全部匹配,如果你自己也匹配就完事了;否则呢,就不匹配了。
你会发现,第 \(i\) 层的所有指针需要 \(i-1\) 层。所以宽搜!
时间复杂度:\(O(n)\).(常数较大,需要提高效率)
实际得分:\(100pts\).
#pragma GCC optimize(2)
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+1;
inline int read(){char ch=getchar();int f=1;while(ch<'0' || ch>'9') {if(ch=='-') f=-f; ch=getchar();}
int x=0;while(ch>='0' && ch<='9') x=(x<<3)+(x<<1)+ch-'0',ch=getchar();return x*f;}
struct tree {
int fail,end; //失配指针,单词个数
int nxt[26];
};
tree t[N];
int cnt=0;
inline void build_tree(string s) {
int p=0;
for(int i=0,tt;i<s.length();i++) {
tt=s[i]-'a';
if(!t[p].nxt[tt]) t[p].nxt[tt]=++cnt;
p=t[p].nxt[tt];
} t[p].end++;
} //建树
queue<int>q;
inline void getFail() {
for(int i=0;i<26;i++)
if(t[0].nxt[i]) {
t[t[0].nxt[i]].fail=0;
q.push(t[0].nxt[i]);
} //根节点的儿子直接标记
while(!q.empty()) {
int now=q.front(); q.pop();
for(int i=0;i<26;i++)
if(t[now].nxt[i]) {
t[t[now].nxt[i]].fail=t[t[now].fail].nxt[i];
q.push(t[now].nxt[i]);
} else t[now].nxt[i]=t[t[now].fail].nxt[i];
} //宽搜
}
inline int AC(string s) {
int p=0,ans=0;
for(int i=0,tt;i<s.length();i++) {
tt=s[i]-'a'; p=t[p].nxt[tt];
for(int j=p;j && t[j].end!=-1;j=t[j].fail) {
ans+=t[j].end;
t[j].end=-1; //为了防止一个子树被走多次
} //只要不为空,就一直记录
} return ans;
}
int main(){
int n=read(); string s;
while(n--) {
cin>>s;
build_tree(s);
} t[0].fail=0; //初始化
getFail();
cin>>s; int x=AC(s);
printf("%d\n",x);
return 0;
}
洛谷 P3808 【模板】AC自动机(简单版) 题解的更多相关文章
- 洛谷P3808 & P3796 AC自动机模板
题目:P3808:https://www.luogu.org/problemnew/show/P3808 P3796:https://www.luogu.org/problemnew/show/P37 ...
- 洛谷 - P3966 - 单词 - AC自动机
https://www.luogu.org/problemnew/show/P3966 因为文本串就是字典本身,所以这个和平时的AC自动机不太一样.平时的query要沿着fail树把子树的出现次数依次 ...
- [模板][P3808]AC自动机(简单版)
Description: 求n个模式串中有几个在文本串中出现 Solution: 模板,详见代码: #include<bits/stdc++.h> using namespace std; ...
- 洛谷.3121.审查(AC自动机 链表)
题目链接 //删掉一个单词需要前移一段位置,用链表维护就好了 复杂度O(sum(len)) #include <cstdio> #include <cstring> #defi ...
- 洛谷 - P2444 - 病毒 - AC自动机
https://www.luogu.org/problemnew/show/P2444 有点恶心,不太明白fail的意义. #include<bits/stdc++.h> using na ...
- 洛谷 P3804 [模板] 后缀自动机
题目:https://www.luogu.org/problemnew/show/P3804 模仿了一篇题解,感觉很好写啊. 代码如下: #include<cstdio> #include ...
- 洛谷P3373 [模板]线段树 2(区间增减.乘 区间求和)
To 洛谷.3373 [模板]线段树2 题目描述 如题,已知一个数列,你需要进行下面两种操作: 1.将某区间每一个数加上x 2.将某区间每一个数乘上x 3.求出某区间每一个数的和 输入输出格式 输入格 ...
- 洛谷P1484 种树&洛谷P3620 [APIO/CTSC 2007]数据备份 题解(堆+贪心)
洛谷P1484 种树&洛谷P3620 [APIO/CTSC 2007]数据备份 题解(堆+贪心) 标签:题解 阅读体验:https://zybuluo.com/Junlier/note/132 ...
- 洛谷P3808 【模板】AC自动机(简单版)
题目背景 这是一道简单的AC自动机模板题. 用于检测正确性以及算法常数. 为了防止卡OJ,在保证正确的基础上只有两组数据,请不要恶意提交. 管理员提示:本题数据内有重复的单词,且重复单词应该计算多次, ...
- 【刷题】洛谷 P3808 【模板】AC自动机(简单版)
题目背景 这是一道简单的AC自动机模板题. 用于检测正确性以及算法常数. 为了防止卡OJ,在保证正确的基础上只有两组数据,请不要恶意提交. 管理员提示:本题数据内有重复的单词,且重复单词应该计算多次, ...
随机推荐
- 如何使用隐式转换扩展DataFrame和RDD以及其他的对象
目的 DataFrame可以点出来很多方法,都是DF内置的. 比如说:df.withColumn(),df.printSchema(). 但是如果你想打印df中的分区位置信息,以及每个key有多少记录 ...
- create view and switch view
pageView扩展backbone cAbstractApp定义view加载.切换.回退.跳转-webApp/cWebViewApp/hybirdApp为其子类 1.cWebApp扩展了父类的bin ...
- 5——PHP逻辑运算符&&唯一的三元运算符
*/ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.cpp * 作者:常轩 * 微信公众号:Worldhe ...
- IP 数据报
IP 数据报 1.IP 数据报的格式 一个 IP 数据报由首部和数据两部分组成.(数据报也可以说是数据包) 首部的前一部分是固定长度,共 20 字节,是所有 IP 数据报必须具有的. 在首部的固定部分 ...
- 使用thymeleaf模板实现博客评论的异步刷新
使用thymeleaf模板实现博客评论的异步刷新 最简单的一个要求:用户可以在博客下面进行评论,然后评论后点击提交后直接上传到数据库,并且局部刷新 这是前端页面的展示,使用的semanticUI进行构 ...
- web前端性能优化一
作为一个前端会允许自己的作品,在非硬性条件下出现卡顿? 肯定是不会,所以给大家梳理一下前端性能的优化. 一:文件操作 html文件压缩: 删除无用的空格和换行符等其他无意义字符 css文件压缩: 删除 ...
- 7-8 jmu-python-从列表中删除元素 (15 分)
删除列表中所有符合条件的值. 输入格式: 输入n,代表要测试n次.每次测试:首先,输入1行字符串(字符串内的元素使用空格分隔)然后,输入要删除的元素x. 输出格式: 输出删除元素x后的每行字符串.如果 ...
- 纯JS实现KeyboardNav(学习笔记)一
纯JS实现KeyboardNav(学习笔记)一 这篇博客只是自己的学习笔记,供日后复习所用,没有经过精心排版,也没有按逻辑编写 GitHub项目源码 预览地址 最终效果 KeyboardNav使用指南 ...
- 盘点Linux运维常用工具(二)-web篇之nginx
1.nginx的概述 .nginx是一个开源的.支持高性能.高并发的WWW服务和代理服务软件 .是由俄罗斯人Igor Sysoev开发的,具有高并发.占用系统资源少等特性 .官网:http://ngi ...
- CSS的四种样式
行内式CSS样式 在标签内部使用的样式 <div id="one" style="width:50p"></div> 内嵌式CSS样式 ...