AC自动机总结及板子(不带指针)
蒟蒻最近想学个AC自动机简直被网上的板子搞疯了,随便点开一个都是带指针的,然而平时用到指针的时候并不多,看到这些代码也完全是看不懂的状态。只好在大概理解后自己脑补(yy)了一下AC自动机的代码,居然还过了,这里对学到的东西做一点小小的总结。顺便造福一下跟我之前一样没有学过AC自动机并且不会用指针的Oier,给出一段不带指针的板子。
AC自动机的模型很好理解,就是在Trie树上做类似于KMP的操作。所以说在AC自动机里也会有一个类似于 next 数组的东西------ fail 数组来作为失配指针。它指向的 目标结点所代表的字符串 是 当前结点所代表的字符串 的最长后缀。
到这里,大概就能看出该算法的基本用途。AC自动机兼顾了 Trie树 和 KMP 的优点,多用来解决多模式串的匹配问题,即给你许多个模式串,问你这些模式串在给出的文本串里的出现情况。一般来说,AC自动机的复杂度为O(n+m),n为匹配串即文本串的长度,m为模式串的总长。在运用AC自动机时大致分为这几个步骤:建一棵 Trie树 把题目给出的模式串存入;然后建立自动机,即生成 fail 数组,一般采用 BFS 来实现这一步(在建立自动机时,我们不仅计算了 fail 数组,同时还确定了结点之间的父子关系。对于一个结点 i ,它的 fail ,即为它父亲的 fail 所对应的子结点。对于一个结点 i ,它孩子的 fail (如果该孩子在建立自动机前为空),即为 它一直失配直到找到一个存在的对应的子结点);最后一步直接将文本串放在自动机上跑就行,原理和KMP一样。
#include<iostream> #include<cstdlib> #include<cstdio> #include<cstring> #include<queue> #include<algorithm> #define il inline #define RG register #define N 10010 using namespace std; char s[N][55],ss[N*100]; int n,times[N];//times记录单词在文本串中出现的次数 struct Tri{ int son[N][26],fail[N],root,L,num[N]; il void init(){ L=0; root=newnode(); memset(fail,0,sizeof(fail)); memset(num,0,sizeof(num)); } il int newnode(){ for( int i=0;i<26;i++ ) son[L][i] = -1; L++; return L-1; } il void insert( char s[],int v ){ int len=strlen(s),cur=root; for(int i=0;i<len;i++){ if( son[cur][s[i]-'a']==-1 ) son[cur][s[i]-'a']=newnode(); cur=son[cur][s[i]-'a']; } num[cur]=v; //记录该匹配串的输入编号 } il void build(){ //bfs的方式来建立自动机 queue<int>Q; fail[root]=root; for(RG int i=0;i<26;i++) if( son[root][i]==-1 ) son[root][i]=root; else{ fail[ son[root][i] ]=root; Q.push( son[root][i] ); } while( !Q.empty() ){ RG int cur=Q.front(); Q.pop(); for(RG int i=0;i<26;i++ ) if( son[cur][i]==-1 ) son[cur][i]=son[ fail[cur] ][i]; else{ fail[ son[cur][i] ]=son[ fail[cur] ][i]; Q.push( son[cur][i] ); } } } il void query( char s[] ){ RG int len=strlen(s),cur=root; for(RG int i=0;i<len;i++){ while( cur && !son[cur][s[i]-'a'] ) cur=fail[cur]; if( son[ cur][s[i]-'a' ] ){ cur=son[cur][s[i]-'a']; RG int k=cur; while(k) times[ num[k] ]++,k=fail[k]; } } } }AC; int main(){ scanf("%d",&n); AC.init(); for(RG int i = 1;i<=n;i++){ scanf("%s",s[i]); AC.insert(s[i],i); } AC.build(); scanf("%s",ss); AC.query(ss); for( RG int i=1;i<=n;i++ ) printf("%s %d\n",s[i],times[i]); return 0; }
最后给推荐几道简单的AC自动机的练手题:
HDU 2222 Keywords Search(丝毫不加掩饰的板子题)
HDU 3065 病毒侵袭持续中(注意这道题,输入有多组数据,题目中没说)
AC自动机总结及板子(不带指针)的更多相关文章
- HDU-3065 病毒侵袭持续中 AC自动机又是一板子!
病毒侵袭持续中 上一题是求出现多少病毒输出病毒序号,而这题输出每个病毒出现的次数.这题有字典树基础都能做出来,把叶子节点用相应的编号标记起来,匹配的时候遍历到叶子节点用一个数组把次数存起来就行了. 有 ...
- 「笔记」AC 自动机
目录 写在前面 定义 引入 构造 暴力 字典图优化 匹配 在线 离线 复杂度 完整代码 例题 P3796 [模板]AC 自动机(加强版) P3808 [模板]AC 自动机(简单版) 「JSOI2007 ...
- BZOJ2434 [Noi2011]阿狸的打字机(AC自动机 + fail树 + DFS序 + 线段树)
题目这么说的: 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机.打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母.经阿狸研究发现,这个打字机是这样工作的: 输入小 ...
- 【BZOJ-2434】阿狸的打字机 AC自动机 + Fail树 + DFS序 + 树状数组
2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2022 Solved: 1158[Submit][Sta ...
- 【模板】AC自动机(简单版)
我:“woc...AC自动机?” 我:“可以自动AC???” 然鹅... 大佬:“傻...” 我:“(⊙_⊙)?” 大佬:“缺...” 我:“......” (大佬...卒 | 逃...) emm.. ...
- [算法模版]AC自动机
[算法模版]AC自动机 基础内容 板子不再赘述,OI-WIKI有详细讲解. \(query\)函数则是遍历文本串的所有位置,在文本串的每个位置都沿着\(fail\)跳到根,将沿途所有元素答案++.意义 ...
- hdu2222 Keywords Search(AC自动机初步)
题目大意: 给出多个模式串和一个主串,求多少个模式串在主串中出现过. 传送门 这是一道AC自动机的模板题. 在学习AC自动机之前,首先要学习WA自动机.TLE自动机和MLE自动机(雾 AC自动机是一种 ...
- AC自动机算法详解 (转载)
首先简要介绍一下AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章, ...
- AC自动机算法小结
AC自动机,可惜不能自动AC 转载:飘过的小牛 OIer55242 简介 Aho-Corasick automation 该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.一个常见的例子就 ...
随机推荐
- .Net中的AOP系列之《将AOP作为架构工具》
返回<.Net中的AOP>系列学习总目录 本篇目录 编译时初始化和验证 编译时初始化 切面验证的正确用法 真实案例:复习线程 架构约束 强制架构 真实案例:NHibernate 多播 类级 ...
- 摘抄自知乎的redis相关
1.知乎日报的基础数据和统计信息是用 Redis 存储的,这使得请求的平均响应时间能在 10ms 以下.其他数据仍然需要存放在另外的地方,其实完全用 Redis 也是可行的,主要的考量是内存占用.就使 ...
- Spring boot 1: 使用IDEA创建Spring boot项目
项目用到的环境: Windows 10 JDK8 IntelliJ IDEA 2017.1.3 Apache Tomcat 8 Maven 3.3.3 使用IDEA新建spring boot项目 新建 ...
- 身份证识别OCR,开启视频模式扫一扫即可识别身份证信息
文章摘要:身份证识别等证件识别OCR技术在各个行业得到广泛应用,例如:车险移动查勘会用到身份证识别.行驶证识别.车架号识别: 寿险移动展业会用到名片识别.银行卡识别:电信实名制代理网点采集身份证信息会 ...
- 读Zepto源码之属性操作
这篇依然是跟 dom 相关的方法,侧重点是操作属性的方法. 读Zepto源码系列文章已经放到了github上,欢迎star: reading-zepto 源码版本 本文阅读的源码为 zepto1.2. ...
- 使用Spring mvc接收整个url地址及参数时注意事项
使用Spring mvc接收整个url地址及参数时注意事项:url= http://baidu?oid=9525c1f2b2cd45019b30a37bead6ebbb&td=2015-08- ...
- linux下swoole的安装
//官方推荐的安装方式1:下载压缩包 wget https://github.com/swoole/swoole-src/archive/swoole-1.8.4-stable.zip 2:解压缩 u ...
- HBuilder使用方法
/*注:本教程针对HBuilder5.0.0,制作日期2014-12-31*/创建HTML结构: h 8 (敲h激活代码块列表,按8选择第8个项目,即HTML代码块,或者敲h t Enter)中途换行 ...
- 【LeetCode】219. Contains Duplicate II
题目: Given an array of integers and an integer k, find out whether there are two distinct indices i a ...
- Object-C知识点 (四) 性能优化
#pragma mark - 性能优化 1. 行高一定要缓存 缓存行高是解决性能优化的最佳途径(除非刷新频率已经很高了,否则一定要缓存)2. 尽量减少计算,所有需要素材提前计算好3. 控件不要设置圆角 ...