hdu 1277 AC自动机入门(指针版和数组版)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1277
推荐一篇博客(看思路就可以,实现用的是java):
https://www.cnblogs.com/nullzx/p/7499397.html
这是一道模板题,拿来练手,之前看了一篇博客,有点错误,但是hdu上面居然过了,最主要的是我在hdu上面三道AC自动机模板题都是这个错的代码,居然都过了,害的我纠结了一晚上,原来是数据太水了。
主要还是看上面的博客,写了点注释,不一定对,以后好拿来复习。
代码(指针版):
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<map>
#include<stack>
#include<cmath>
#include<vector>
#include<set>
#include<cstdio>
#include<string>
#include<deque>
using namespace std;
typedef long long LL;
#define eps 1e-8
#define INF 0x3f3f3f3f
#define maxn 10005
char str[maxn][];
char s[];
struct node{
int id;//记录当前关键字的编号
node *next[];//指向儿子
node *fail;//失配后指向的地方,相当于KMP里面的next数组的作用
node(){
id=-;
memset(next,,sizeof(next));
fail=NULL;
}
};
queue<int>qe;//记录出现的关键字编号
queue<node*>q;//BFS
int n,m,k,t;
void insert(char *s,node *root,int ID){//插入关键字到trie里面
node *p=root;
int len=strlen(s);
for(int i=;i<len;i++){
int id=s[i]-'';
if(p->next[id]==NULL)
p->next[id]=new node();
p=p->next[id];
}
p->id=ID;//在关键字结束的地方把id更新为关键字的ID
}
void build_fail(node *root){//构建fail指针,要和KMP算法联想起来作比较
while(!q.empty())
q.pop();
q.push(root);
while(!q.empty()){
node *temp=q.front();
q.pop();
for(int i=;i<;i++){
if(temp->next[i]==NULL)
continue;
if(temp==root)//让root节点的所有儿子的fail指针都指向root,相当于next[0]=-1
temp->next[i]->fail=root;
else{
node *p=temp->fail;//把temp->fail赋给p,因为接下来p要改变
while(p!=NULL){//一直向fail方向走,直到找到某个点的next[i]!=NULL或者p==NULL(找不到)
if(p->next[i]!=NULL){
temp->next[i]->fail=p->next[i];
break;
}
p=p->fail;
}
if(p==NULL)//如果找不到,就让temp的儿子i的fail指针指向根
temp->next[i]->fail=root;
}
q.push(temp->next[i]);
}
}
}
void query(node *root){
while(!qe.empty())
qe.pop();
node *temp=root;
for(int i=;i<n;i++){
for(int j=;j<;j++){
int id=str[i][j]-'';
//一直往fail指向的方向找,直到找到或者到了root,相当于KMP里面K一直等于next[K],最后匹配成功或者K=-1
while(temp->next[id]==NULL&&temp!=root)
temp=temp->fail;
temp=temp->next[id];//temp下移
if(temp==NULL)
temp=root;
node *p=temp;
while(p!=root){//在所有的以i+'0'字符结尾的前缀里面找以这个字符结束的单词
if(p->id!=-){//注意这个p->id的位置,刚刚学,看了错的博客,把它写在了上面,hdu居然过了,纠结了我老半天
qe.push(p->id);
p->id=-;//因为可能会有多个后缀和某一个前缀相同,可能会重复计数,所以我们要标记一下
}
p=p->fail;
}
}
}
}
void destroy(node *root){
if(root==NULL)
return;
for(int i=;i<;i++){
if(root->next[i]!=NULL)
destroy(root->next[i]);
}
delete root;
}
int main()
{
while(scanf("%d%d",&n,&m)!=EOF){
node *root=new node();
for(int i=;i<n;i++)
scanf("%s",str[i]);
getchar();
char c;
for(int i=;i<m;i++){
int num=;//计算空格数量,一旦达到了三个就说明接下来开始输入关键字了
while(num!=&&(c=getchar())){
if(c==' ')
num++;
}
scanf("%s",s);//输入关键字
insert(s,root,i);//把关键字插入字典树
}
build_fail(root);//构建fail指针
query(root);//扫描
if(qe.size()==)
printf("No key can be found !\n");
else{
printf("Found key:");
while(!qe.empty()){
printf(" [Key No. %d]",qe.front()+);
qe.pop();
}
printf("\n");
}
destroy(root);//释放内存
}
return ;
}
代码(数组版):
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<map>
#include<stack>
#include<cmath>
#include<vector>
#include<set>
#include<cstdio>
#include<string>
#include<deque>
using namespace std;
typedef long long LL;
#define eps 1e-8
#define INF 0x3f3f3f3f
#define maxn 600005
int trie[maxn][],fail[maxn],val[maxn],ID[maxn];
char str[][],s[];
int n,m,t,cnt;
queue<int>q;
void init(){
memset(trie,,sizeof(trie));
memset(fail,,sizeof(fail));//让所有点的fail都指向0(根节点)
memset(val,,sizeof(val));
cnt=;
}
void insert(char *s,int k){
int root=;
for(int i=;s[i];i++){
int id=s[i]-'';
if(trie[root][id]==)
trie[root][id]=++cnt;
root=trie[root][id];
}
val[root]++;//标记单词结尾
ID[root]=k;//记录ID
}
void build_fail(){//构建fail指针
while(!q.empty())
q.pop();
int root=;
for(int i=;i<;i++){//把root的儿子都压入队列
if(trie[root][i])
q.push(trie[root][i]);
}
while(!q.empty()){
int u=q.front();
q.pop();
for(int i=;i<;i++){
if(trie[u][i]){//如果u的儿子i存在,然它儿子的fail指向fail[u]的儿子,并压入队列
fail[trie[u][i]]=trie[fail[u]][i];
q.push(trie[u][i]);
}else{//如果不存在,把fail[u]的儿子i变成u的儿子
trie[u][i]=trie[fail[u]][i];
}
}
}
}
void query(){
while(!q.empty())
q.pop();
int u=;
for(int i=;i<n;i++){
for(int j=;j<;j++){
int id=str[i][j]-'';
u=trie[u][id];//u在trie树上往下移
int temp=u;//临时保存u
while(temp!=){//遍历temp和它的fail指向的所有以str[i][j]结尾的前缀,看里面有多少个是单词结尾,这里可以加一个&&val[temp]!=0优化一下
if(val[temp]){//如果是单词结尾
q.push(ID[temp]);//压进队列
val[temp]=;//把标记去掉,防止重复计算
}
temp=fail[temp];//往fail方向走,直到回到根节点
}
}
}
}
int main()
{
while(scanf("%d%d",&n,&m)!=EOF){
init();
for(int i=;i<n;i++){
scanf("%s",str[i]);
}
getchar();
for(int i=;i<m;i++){
int num=;
char c;
while(num!=&&(c=getchar())){
if(c==' '){
num++;
continue;
}
}
scanf("%s",s);
insert(s,i);
}
build_fail();
query();
if(q.size()==)
printf("No key can be found !\n");
else{
printf("Found key:");
while(!q.empty()){
printf(" [Key No. %d]",q.front()+);
q.pop();
}
printf("\n");
}
}
return ;
}
hdu 1277 AC自动机入门(指针版和数组版)的更多相关文章
- hdu 1277 AC自动机
全文检索 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submis ...
- hdu2222 KeyWords Search AC自动机入门题
/** 链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:题意:给定N(N <= 10000)个长度不大于50的模式串,再给定一个长度为L ...
- hdu 2896 AC自动机
// hdu 2896 AC自动机 // // 题目大意: // // 给你n个短串,然后给你q串长字符串,要求每个长字符串中 // 是否出现短串,出现的短串各是什么 // // 解题思路: // / ...
- hdu 3065 AC自动机
// hdu 3065 AC自动机 // // 题目大意: // // 给你n个短串,然后给你一个长串,问:各个短串在长串中,出现了多少次 // // 解题思路: // // AC自动机,插入,构建, ...
- hdu 5880 AC自动机
Family View Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total ...
- hdu 2296 aC自动机+dp(得到价值最大的字符串)
Ring Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submis ...
- hdu 2825 aC自动机+状压dp
Wireless Password Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others ...
- hdu 3065 AC自动机(各子串出现的次数)
病毒侵袭持续中 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Sub ...
- hdu 2222 Keywords Search ac自动机入门
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串. ...
随机推荐
- LeetCode - X of a Kind in a Deck of Cards
In a deck of cards, each card has an integer written on it. Return true if and only if you can choos ...
- CSVN配置自动备份策略
在浏览器中登录CSVN管理页面,登录地址就是ip:3343,版本库->backup schedule ,选择type of job(备份类型),when to run(备份频率和时间),numb ...
- windows server 修改远程桌面连接端口号
1. [运行]输入 regedit 2. 在注册表编辑器中找到以下PortNamber键,改为要使用的远程端口,如10000. HKEY_LOCAL_MACHINE\SYSTEM\CurrentCo ...
- zookeeper启动时报Cannot open channel to X at election address Error contacting service. It is probably not running.
配置storm集群的时候出现如下异常: 2016-06-26 14:10:17,484 [myid:1] - WARN [SyncThread:1:FileTxnLog@334] - fsync-in ...
- vsftpd 新增虚拟用户
接手公司linux服务器,已经用了vsftpd服务,需要增加新用户. vsftpd的配置文件在/etc/vsftpd.其中 编辑virtusers, 添加一个用户名和密码,奇行为用户名,偶行为密码 在 ...
- Spring生态研习【一】:定时任务Spring-task
本系列具体研究一下spring生态中的重要或者常用的功能套件,今天从定时任务开始,主要是spring-task.至于quartz,下次找个时间再总结. 我的验证环境,是SpringCloud体系下,基 ...
- Linux系统时钟的更改
linux系统时钟有两个,一个是硬件时钟,即BIOS时间,就是我们进行CMOS设置时看到的时间,另一个是系统时钟,是linux系统Kernel时间. 查看.设置硬件时间: 查看系统硬件时钟 hwclo ...
- Ubuntu 14.10 下安装Ambari
安装ambari有两种方式,一是自己下载源码编译,另外一个是使用公共仓库 1 使用Public Respositories Step1: Download the Ambari repository ...
- redis集群设置密码
redis集群密码设置 1.密码设置(推荐)方式一:修改所有Redis集群中的redis.conf文件加入: masterauth passwd123 requirepass passwd123 说 ...
- Linux和Windows启动后台程序
平时很多时候,我们需要通过脚本命令调用执行程序,集成一体后方便使用快捷.但是启动脚本窗口比较碍眼,能设置为后台运行既方便又美观. Linux启动后台程序 1.后台执行 nohup方法:不挂断的运行命令 ...