AC自动机模板浅讲
Description
给你N个单词,然后给定一个字符串,问一共有多少单词在这个字符串中出现过(输入相同的字符串算不同的单词,同一个单词重复出现只计一次)。
Input
第一行一个整数N,表示给定单词的个数。
接下来N行,每行输入一个长度不超过50且全由小写字母组成的单词。
最后一行输入一个长度不超过1000000的字符串。
N≤10000
Output
输出一行包含一个整数,表示共在给定字符串中出现过的单词个数。
样例:
Input
5
she
he
say
shr
her
yasherhs
Output
3
关于AC自动机:
Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法。
假设我们已经学会了Trie树,类似于KMP算法的,我们对于树上的每个节点,处理出在此
节点下后,在树上应该跳转到的点,用nxt数组记录;
那么,如何求出nxt数组呢???
首先,如果x接下来要匹配的字符与now节点直接相连,那我们肯定直接跳到下一个节点。
如果当前字符无法继续匹配,就跳到now节点的nxt的与此字符对应的节点上去
然后,与根节点直接相连的节点就直接预处理一下就好了。
例:对于样例,我们先建一棵Trie树(图中加着重号的为每个单词的终止节点)
将所有根节点的子节点的nxt数组指向根节点,再将这些节点加入队列。
然会对于队列里的每一个节点,从a枚举到z,如果当前结点没有这个字符儿子
就将它指向它的nxt节点的儿子,这样我们就成功的将Trie树建成了Trie图
处理出来就是这样知道,然后对文本串依次遍历匹配,统计答案就可以了
code:
#include<bits/stdc++.h>
#define N 1001000
using namespace std;
int cnt,n;
int tree[N],dl[N],num[N],net[N],son[N][30];
char s1[N],s2[N];
void ins(){//建Trie树
int now=0,l=strlen(s1+1);
for(int i=1;i<=l;i++){
if(!son[now][s1[i]-'a'+1])
son[now][s1[i]-'a'+1]=++cnt;
now=son[now][s1[i]-'a'+1];
}
num[now]++;//记录单词尾
}
void get_net(){
int t=1,w=0;
for(int i=1;i<=26;i++)
if(son[0][i])dl[++w]=son[0][i];//预处理与根节点相连的节点
while(t<=w){//BFS处理net数组
int now=dl[t];
for(int i=1;i<=26;i++){
if(!son[now][i])son[now][i]=son[net[now]][i];
else{
net[son[now][i]]=son[net[now]][i];
dl[++w]=son[now][i];
}
}
t++;
}
}
void fuck(){
int now=0,ans=0,l=strlen(s2+1);
for(int i=1;i<=l;i++){
now=son[now][s2[i]-'a'+1];
int to=now;
while(to!=0&&num[to]!=-1){
ans+=num[to];
num[to]=-1;//已经统计过的单词不要再次统计
to=net[to];
}
}
printf("%d\n",ans);
}
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){scanf("%s",s1+1);ins();}
get_net();scanf("%s",s2+1);
fuck();
return 0;
}
蒟蒻题解,欢迎指正;
水平太低,大佬勿喷;
AC自动机模板浅讲的更多相关文章
- HDU 2222 AC自动机模板题
题目: http://acm.hdu.edu.cn/showproblem.php?pid=2222 AC自动机模板题 我现在对AC自动机的理解还一般,就贴一下我参考学习的两篇博客的链接: http: ...
- Match:Keywords Search(AC自动机模板)(HDU 2222)
多模匹配 题目大意:给定很多个字串A,B,C,D,E....,然后再给你目标串str字串,看目标串中出现多少个给定的字串. 经典AC自动机模板题,不多说. #include <iostream& ...
- HDU 3065 (AC自动机模板题)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3065 题目大意:多个模式串,范围是大写字母.匹配串的字符范围是(0~127).问匹配串中含有哪几种模 ...
- HDU 2896 (AC自动机模板题)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2896 题目大意:多个模式串.多个匹配串.其中串的字符范围是(0~127).问匹配串中含有哪几个模式串 ...
- HDU 2222(AC自动机模板题)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2222 题目大意:多个模式串.问匹配串中含有多少个模式串.注意模式串有重复,所以要累计重复结果. 解题 ...
- HDU 2222 (AC自动机模板题)
题意: 给一个文本串和多个模式串,求文本串中一共出现多少次模式串 分析: ac自动机模板,关键是失配函数 #include <map> #include <set> #incl ...
- hdu 2222 Keywords Search ac自动机模板
题目链接 先整理一发ac自动机模板.. #include <iostream> #include <vector> #include <cstdio> #inclu ...
- KMP与AC自动机模板
HDU 1711 Number Sequence(KMP模板题) http://acm.hdu.edu.cn/showproblem.php?pid=1711 #include<bits/std ...
- HDU3695(AC自动机模板题)
题意:给你n个字符串,再给你一个大的字符串A,问你着n个字符串在正的A和反的A里出现多少个? 其实就是AC自动机模板题啊( ╯□╰ ) 正着query一次再反着query一次就好了 /* gyt Li ...
随机推荐
- P3207 [HNOI2010]物品调度
传送门 完了题目看错了--还以为所有的\(x,y\)都要一样--结果题解都没看懂-- 先考虑如果已经求出了所有的\(pos\)要怎么办,那么我们可以把\(0\)也看做是一个箱子,然后最后每个箱子都在一 ...
- SP1557 GSS2 - Can you answer these queries II(线段树)
传送门 线段树好题 因为题目中相同的只算一次,我们可以联想到HH的项链,于是考虑离线的做法 先把所有的询问按$r$排序,然后每一次不断将$a[r]$加入线段树 线段树上维护四个值,$sum,hix,s ...
- js 获取图片宽高 和 图片大小
获取要查看大小的img var img_url = 'http://img5.imgtn.bdimg.com/it/u=4267222417,1017407570&fm=200&gp= ...
- Springboot 三种拦截Rest API的方法-过滤器、拦截器、切片
过滤器方式实现拦截(Filter) 通过继承Servlet的Filter类来实现拦截: @Component public class TimeFilter implements Filter { @ ...
- [Qt Creator 快速入门] 第4章 布局管理
第3章讲述了一些窗口部件,当时往界面上拖放部件时都是随意放置的,这对于学习部件的使用没有太大的影响,但是,对于一个完善的软件,布局管理却是必不可少的. 无论是想要界面中部件有一个很整齐的排列,还是想要 ...
- 【洛谷3239_BZOJ4008】[HNOI2015] 亚瑟王(期望 DP)
题目: 洛谷 3239 分析: 卡牌造成的伤害是互相独立的,所以 \(ans=\sum f_i\cdot d_i\) ,其中 \(f_i\) 表示第 \(i\) 张牌 在整局游戏中 发动技能的概率.那 ...
- ORACLE_AQ 队列
Oracle AQ Demo,Step by Step 我准备用AQ来做一个数据仓库系统,提交分析任务队列.有以下需求: 1.利用通知异步的执行存储过程 2.设定队列大小极限 3.出列即删除 OK,l ...
- UML中类之间的关系
UML中类之间的关系分为以下几种:依赖.关联.泛化.聚合.组合. 依赖是指一个类使用了另一个类,它是一种使用关系,描述了一个事物的规格说明的变化可能会影响到使用它的另一个事物(反之不一定).最常见的依 ...
- Storm概念学习系列之storm的定时任务
不多说,直接上干货! 至于为什么,有storm的定时任务.这个很简单.但是,这个在工作中非常重要! 假设有如下的业务场景 这个spoult源源不断地发送数据,boilt呢会进行处理.然后呢,处理后的结 ...
- [译]libcurl错误码
CURLcode Almost all "easy" interface functions return a CURLcode error code. No matter wha ...