Description

给你N个单词,然后给定一个字符串,问一共有多少单词在这个字符串中出现过(输入相同的字符串算不同的单词,同一个单词重复出现只计一次)。

Input

第一行一个整数N,表示给定单词的个数。

接下来N行,每行输入一个长度不超过50且全由小写字母组成的单词。

最后一行输入一个长度不超过1000000的字符串。

N≤10000

Output

输出一行包含一个整数,表示共在给定字符串中出现过的单词个数。

样例:

Input

5

she

he

say

shr

her

yasherhs

Output

3

关于AC自动机:

Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法。

假设我们已经学会了Trie树,类似于KMP算法的,我们对于树上的每个节点,处理出在此

节点下后,在树上应该跳转到的点,用nxt数组记录;

那么,如何求出nxt数组呢???

首先,如果x接下来要匹配的字符与now节点直接相连,那我们肯定直接跳到下一个节点。

如果当前字符无法继续匹配,就跳到now节点的nxt的与此字符对应的节点上去

然后,与根节点直接相连的节点就直接预处理一下就好了。

例:对于样例,我们先建一棵Trie树(图中加着重号的为每个单词的终止节点)

将所有根节点的子节点的nxt数组指向根节点,再将这些节点加入队列。

然会对于队列里的每一个节点,从a枚举到z,如果当前结点没有这个字符儿子

就将它指向它的nxt节点的儿子,这样我们就成功的将Trie树建成了Trie图



处理出来就是这样知道,然后对文本串依次遍历匹配,统计答案就可以了

code:

#include<bits/stdc++.h>
#define N 1001000
using namespace std;
int cnt,n;
int tree[N],dl[N],num[N],net[N],son[N][30];
char s1[N],s2[N];
void ins(){//建Trie树
int now=0,l=strlen(s1+1);
for(int i=1;i<=l;i++){
if(!son[now][s1[i]-'a'+1])
son[now][s1[i]-'a'+1]=++cnt;
now=son[now][s1[i]-'a'+1];
}
num[now]++;//记录单词尾
}
void get_net(){
int t=1,w=0;
for(int i=1;i<=26;i++)
if(son[0][i])dl[++w]=son[0][i];//预处理与根节点相连的节点
while(t<=w){//BFS处理net数组
int now=dl[t];
for(int i=1;i<=26;i++){
if(!son[now][i])son[now][i]=son[net[now]][i];
else{
net[son[now][i]]=son[net[now]][i];
dl[++w]=son[now][i];
}
}
t++;
}
}
void fuck(){
int now=0,ans=0,l=strlen(s2+1);
for(int i=1;i<=l;i++){
now=son[now][s2[i]-'a'+1];
int to=now;
while(to!=0&&num[to]!=-1){
ans+=num[to];
num[to]=-1;//已经统计过的单词不要再次统计
to=net[to];
}
}
printf("%d\n",ans);
}
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){scanf("%s",s1+1);ins();}
get_net();scanf("%s",s2+1);
fuck();
return 0;
}

蒟蒻题解,欢迎指正;

水平太低,大佬勿喷;

AC自动机模板浅讲的更多相关文章

  1. HDU 2222 AC自动机模板题

    题目: http://acm.hdu.edu.cn/showproblem.php?pid=2222 AC自动机模板题 我现在对AC自动机的理解还一般,就贴一下我参考学习的两篇博客的链接: http: ...

  2. Match:Keywords Search(AC自动机模板)(HDU 2222)

    多模匹配 题目大意:给定很多个字串A,B,C,D,E....,然后再给你目标串str字串,看目标串中出现多少个给定的字串. 经典AC自动机模板题,不多说. #include <iostream& ...

  3. HDU 3065 (AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=3065 题目大意:多个模式串,范围是大写字母.匹配串的字符范围是(0~127).问匹配串中含有哪几种模 ...

  4. HDU 2896 (AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2896 题目大意:多个模式串.多个匹配串.其中串的字符范围是(0~127).问匹配串中含有哪几个模式串 ...

  5. HDU 2222(AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2222 题目大意:多个模式串.问匹配串中含有多少个模式串.注意模式串有重复,所以要累计重复结果. 解题 ...

  6. HDU 2222 (AC自动机模板题)

    题意: 给一个文本串和多个模式串,求文本串中一共出现多少次模式串 分析: ac自动机模板,关键是失配函数 #include <map> #include <set> #incl ...

  7. hdu 2222 Keywords Search ac自动机模板

    题目链接 先整理一发ac自动机模板.. #include <iostream> #include <vector> #include <cstdio> #inclu ...

  8. KMP与AC自动机模板

    HDU 1711 Number Sequence(KMP模板题) http://acm.hdu.edu.cn/showproblem.php?pid=1711 #include<bits/std ...

  9. HDU3695(AC自动机模板题)

    题意:给你n个字符串,再给你一个大的字符串A,问你着n个字符串在正的A和反的A里出现多少个? 其实就是AC自动机模板题啊( ╯□╰ ) 正着query一次再反着query一次就好了 /* gyt Li ...

随机推荐

  1. JeePlus:项目部署

    ylbtech-JeePlus:项目部署 1.返回顶部 1. 项目部署 1 开发工具:idea/eclipse/myeclipse+ mysql/oracle+tomcat6/7/8. 下面以ecli ...

  2. bzoj2287

    背包+fft 既然要不选一个东西,那么我们求出前缀背包和后缀背包,每次答案就是f[i-1][w]*g[i+1][j-w] 但是这样复杂度还是n^3,跑不过,但是我们发现上面那个东西不就是个裸卷积吗,直 ...

  3. 利用 BASE64Encoder 对字符串进行加密 BASE64Decoder进行解密

    转自:https://blog.csdn.net/chenyongtu110/article/details/51694323

  4. [读书笔记2]《C语言嵌入式系统编程修炼》

    第3章 屏幕操作   3.1 汉字处理 现在要解决的问题是,嵌入式系统中经常要使用的并非是完整的汉字库,往往只是需要提供数量有限的汉字供必要的显示功能.例如,一个微波炉的LCD上没有必要提供显示&qu ...

  5. hdu5926Mr. Frog’s Game

    Mr. Frog's Game Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) ...

  6. 数据库恢复挂起解决办法【MSSQL】

    新建查询输入如下代码运行 - -把test改成你需要修复的数据库名 USE master GO ALTER DATABASE test SET SINGLE_USER GO ALTER DATABAS ...

  7. duilib入门问题集

    问:如何把资源放入zip?答: 先SetResourcePath设置资源目录,再SetResourceZip设置压缩资源文件名 问:如何设置窗体的初始化大小?答:设置XML文件的Window标签的si ...

  8. tensorFlow资源

    1,[莫烦]Tensorflow tutorials (Eng Sub) 神经网络 http://www.bilibili.com/video/av10118932/index_35.html#pag ...

  9. 语音跟踪:信号分解、锁相、鸡尾酒会效应、基于PR的信号分离

    NLP中关于语音的部分,其中重要的一点是语音信号从背景噪音中分离.比如在一个办公室场景中,有白天的底噪-类似于白噪音的噪音.空调的声音.键盘的啪啪声.左手边45度7米元的地方同事讨论的声音.右手边1. ...

  10. CNN结构:可用于时序预测复合的DNN结构-AcGANs、误差编码网络 ENN

    前言:模式识别问题 模式函数是一个从问题定义域到模式值域的一个单射. 从简单的贝叶斯方法,到只能支持二分类的原始支持向量机,到十几个类的分类上最好用的随机森林方法,到可以支持ImageNet上海量18 ...