hdu 1277 AC自动机入门(指针版和数组版)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1277
推荐一篇博客(看思路就可以,实现用的是java):
https://www.cnblogs.com/nullzx/p/7499397.html
这是一道模板题,拿来练手,之前看了一篇博客,有点错误,但是hdu上面居然过了,最主要的是我在hdu上面三道AC自动机模板题都是这个错的代码,居然都过了,害的我纠结了一晚上,原来是数据太水了。
主要还是看上面的博客,写了点注释,不一定对,以后好拿来复习。
代码(指针版):
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<map>
#include<stack>
#include<cmath>
#include<vector>
#include<set>
#include<cstdio>
#include<string>
#include<deque>
using namespace std;
typedef long long LL;
#define eps 1e-8
#define INF 0x3f3f3f3f
#define maxn 10005
char str[maxn][];
char s[];
struct node{
int id;//记录当前关键字的编号
node *next[];//指向儿子
node *fail;//失配后指向的地方,相当于KMP里面的next数组的作用
node(){
id=-;
memset(next,,sizeof(next));
fail=NULL;
}
};
queue<int>qe;//记录出现的关键字编号
queue<node*>q;//BFS
int n,m,k,t;
void insert(char *s,node *root,int ID){//插入关键字到trie里面
node *p=root;
int len=strlen(s);
for(int i=;i<len;i++){
int id=s[i]-'';
if(p->next[id]==NULL)
p->next[id]=new node();
p=p->next[id];
}
p->id=ID;//在关键字结束的地方把id更新为关键字的ID
}
void build_fail(node *root){//构建fail指针,要和KMP算法联想起来作比较
while(!q.empty())
q.pop();
q.push(root);
while(!q.empty()){
node *temp=q.front();
q.pop();
for(int i=;i<;i++){
if(temp->next[i]==NULL)
continue;
if(temp==root)//让root节点的所有儿子的fail指针都指向root,相当于next[0]=-1
temp->next[i]->fail=root;
else{
node *p=temp->fail;//把temp->fail赋给p,因为接下来p要改变
while(p!=NULL){//一直向fail方向走,直到找到某个点的next[i]!=NULL或者p==NULL(找不到)
if(p->next[i]!=NULL){
temp->next[i]->fail=p->next[i];
break;
}
p=p->fail;
}
if(p==NULL)//如果找不到,就让temp的儿子i的fail指针指向根
temp->next[i]->fail=root;
}
q.push(temp->next[i]);
}
}
}
void query(node *root){
while(!qe.empty())
qe.pop();
node *temp=root;
for(int i=;i<n;i++){
for(int j=;j<;j++){
int id=str[i][j]-'';
//一直往fail指向的方向找,直到找到或者到了root,相当于KMP里面K一直等于next[K],最后匹配成功或者K=-1
while(temp->next[id]==NULL&&temp!=root)
temp=temp->fail;
temp=temp->next[id];//temp下移
if(temp==NULL)
temp=root;
node *p=temp;
while(p!=root){//在所有的以i+'0'字符结尾的前缀里面找以这个字符结束的单词
if(p->id!=-){//注意这个p->id的位置,刚刚学,看了错的博客,把它写在了上面,hdu居然过了,纠结了我老半天
qe.push(p->id);
p->id=-;//因为可能会有多个后缀和某一个前缀相同,可能会重复计数,所以我们要标记一下
}
p=p->fail;
}
}
}
}
void destroy(node *root){
if(root==NULL)
return;
for(int i=;i<;i++){
if(root->next[i]!=NULL)
destroy(root->next[i]);
}
delete root;
}
int main()
{
while(scanf("%d%d",&n,&m)!=EOF){
node *root=new node();
for(int i=;i<n;i++)
scanf("%s",str[i]);
getchar();
char c;
for(int i=;i<m;i++){
int num=;//计算空格数量,一旦达到了三个就说明接下来开始输入关键字了
while(num!=&&(c=getchar())){
if(c==' ')
num++;
}
scanf("%s",s);//输入关键字
insert(s,root,i);//把关键字插入字典树
}
build_fail(root);//构建fail指针
query(root);//扫描
if(qe.size()==)
printf("No key can be found !\n");
else{
printf("Found key:");
while(!qe.empty()){
printf(" [Key No. %d]",qe.front()+);
qe.pop();
}
printf("\n");
}
destroy(root);//释放内存
}
return ;
}
代码(数组版):
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<map>
#include<stack>
#include<cmath>
#include<vector>
#include<set>
#include<cstdio>
#include<string>
#include<deque>
using namespace std;
typedef long long LL;
#define eps 1e-8
#define INF 0x3f3f3f3f
#define maxn 600005
int trie[maxn][],fail[maxn],val[maxn],ID[maxn];
char str[][],s[];
int n,m,t,cnt;
queue<int>q;
void init(){
memset(trie,,sizeof(trie));
memset(fail,,sizeof(fail));//让所有点的fail都指向0(根节点)
memset(val,,sizeof(val));
cnt=;
}
void insert(char *s,int k){
int root=;
for(int i=;s[i];i++){
int id=s[i]-'';
if(trie[root][id]==)
trie[root][id]=++cnt;
root=trie[root][id];
}
val[root]++;//标记单词结尾
ID[root]=k;//记录ID
}
void build_fail(){//构建fail指针
while(!q.empty())
q.pop();
int root=;
for(int i=;i<;i++){//把root的儿子都压入队列
if(trie[root][i])
q.push(trie[root][i]);
}
while(!q.empty()){
int u=q.front();
q.pop();
for(int i=;i<;i++){
if(trie[u][i]){//如果u的儿子i存在,然它儿子的fail指向fail[u]的儿子,并压入队列
fail[trie[u][i]]=trie[fail[u]][i];
q.push(trie[u][i]);
}else{//如果不存在,把fail[u]的儿子i变成u的儿子
trie[u][i]=trie[fail[u]][i];
}
}
}
}
void query(){
while(!q.empty())
q.pop();
int u=;
for(int i=;i<n;i++){
for(int j=;j<;j++){
int id=str[i][j]-'';
u=trie[u][id];//u在trie树上往下移
int temp=u;//临时保存u
while(temp!=){//遍历temp和它的fail指向的所有以str[i][j]结尾的前缀,看里面有多少个是单词结尾,这里可以加一个&&val[temp]!=0优化一下
if(val[temp]){//如果是单词结尾
q.push(ID[temp]);//压进队列
val[temp]=;//把标记去掉,防止重复计算
}
temp=fail[temp];//往fail方向走,直到回到根节点
}
}
}
}
int main()
{
while(scanf("%d%d",&n,&m)!=EOF){
init();
for(int i=;i<n;i++){
scanf("%s",str[i]);
}
getchar();
for(int i=;i<m;i++){
int num=;
char c;
while(num!=&&(c=getchar())){
if(c==' '){
num++;
continue;
}
}
scanf("%s",s);
insert(s,i);
}
build_fail();
query();
if(q.size()==)
printf("No key can be found !\n");
else{
printf("Found key:");
while(!q.empty()){
printf(" [Key No. %d]",q.front()+);
q.pop();
}
printf("\n");
}
}
return ;
}
hdu 1277 AC自动机入门(指针版和数组版)的更多相关文章
- hdu 1277 AC自动机
全文检索 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submis ...
- hdu2222 KeyWords Search AC自动机入门题
/** 链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:题意:给定N(N <= 10000)个长度不大于50的模式串,再给定一个长度为L ...
- hdu 2896 AC自动机
// hdu 2896 AC自动机 // // 题目大意: // // 给你n个短串,然后给你q串长字符串,要求每个长字符串中 // 是否出现短串,出现的短串各是什么 // // 解题思路: // / ...
- hdu 3065 AC自动机
// hdu 3065 AC自动机 // // 题目大意: // // 给你n个短串,然后给你一个长串,问:各个短串在长串中,出现了多少次 // // 解题思路: // // AC自动机,插入,构建, ...
- hdu 5880 AC自动机
Family View Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total ...
- hdu 2296 aC自动机+dp(得到价值最大的字符串)
Ring Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submis ...
- hdu 2825 aC自动机+状压dp
Wireless Password Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others ...
- hdu 3065 AC自动机(各子串出现的次数)
病毒侵袭持续中 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Sub ...
- hdu 2222 Keywords Search ac自动机入门
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串. ...
随机推荐
- 14.python-CS编程
一.客户端/服务器架构1.C/S架构:(1)硬件C/S架构(打印机)(2)软件C/S架构(web服务)2.生活中的C/S架构:饭店是S端,所有食客是C端3.C/S架构与socket的关系:socke就 ...
- (27)session(设置值、取值、修改、删除)
session的由来 Cookie虽然在一定程度上解决了“保持状态”的需求,但是由于Cookie本身最大支持4096字节,以及Cookie本身保存在客户端,可能被拦截或窃取,因此就需要有一种新的东西, ...
- for break
public static void main(String[] args) { aaa: for (int j = 0; j < 2; j++) { System.out.println(&q ...
- php输出数据到csv文件
function export() { $fileName = date('Y-m-d').uniqid().'.csv'; set_time_limit(0); ini_set('memory_li ...
- zabbix图形化界面乱码(二)
中文字体乱码,解决办法: 1:从Windos下拷贝字体到服务器,C:\Windows\Fonts,有很多,看着喜欢的拷贝 2:然后在zabbix 服务端,进入到zabbix web的工作目 ...
- mysql悲观锁
悲观锁与乐观锁是两种常见的资源并发锁设计思路,也是并发编程中一个非常基础的概念. 悲观锁(Pessimistic Lock) 悲观锁的特点是先获取锁,再进行业务操作,即“悲观”的认为获取锁是非常有可能 ...
- (C#)中的DataSet、string、DataTable等对象转换成Json
ConvertJson.cs类 using System; using System.Collections.Generic; using System.Text; using System.Data ...
- flex 布局压缩问题
在 flex 布局中,当有一个元素宽度过长时,另一个元素宽度会被压缩, 如下图: 解决办法:在不想被压缩的元素上加上样式 flex-shrink: 0; 效果图:
- react 在 componentWillMount() 中调用异步函数时,componentWillMount() finishes after render()
刚开始使用 react,很多属性.方法不是很熟.在此记录下我所遇到的问题及解决方法. 我在 componentWillMount() 中调用了一个异步函数,在返回结果中调用 this.setState ...
- git tag 常用操作
1.获取最新tag(获取不到就多获取几次) git fetch origin 或者 git fetch origin <tagname> 2. checkout tag到本地分支(如果看 ...