Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)
Total Submission(s): 51758    Accepted Submission(s):
16671

Problem Description
In the modern time, Search engine came into the life of
everybody like Google, Baidu, etc.
Wiskey also wants to bring this feature to
his image retrieval system.
Every image have a long description, when users
type some keywords to find the image, the system will match the keywords with
description of image and show the image which the most keywords be
matched.
To simplify the problem, giving you a description of image, and some
keywords, you should tell me how many keywords will be match.
 
Input
First line will contain one integer means how many
cases will follow by.
Each case will contain two integers N means the number
of keywords and N keywords follow. (N <= 10000)
Each keyword will only
contains characters 'a'-'z', and the length will be not longer than 50.
The
last line is the description, and the length will be not longer than
1000000.
 
Output
Print how many keywords are contained in the
description.
 
Sample Input

she
he
say
shr
her
yasherhs
 
Sample Output

 
Author
Wiskey
 
Recommend
lcy   |   We have carefully selected several similar problems for you:  2896 3065 2243 2825 3341 
(转自 http://acm.hdu.edu.cn/showproblem.php?pid=2222)

  先讲讲大意,就是给一大堆模板串,再给一串很长的文本串,求有几个模板串在这个文本串中出现过
  首先,模板串的长度较短,数量多,极其符合ac自动机的特点,就这么愉快地决定使用ac自动机(其实也并不是特别地愉快
,虽说是裸题)
  接着注意几个事项
  1.模板串重复出现,比如下面这组数据

aa
bb
aa
aabbcc

  2.多组数据,第一个输入的数是数据组数(这个问题应该不大)

  3.如果用数组的话不要一次性用memset把整个数组都赋值,这样的话是十分浪费时间的

接着附上用指针写的AC自动机(虽说我用数组写了一个,调试了2天都没有调出来,果断重写)

Code

 /*
* acm.hdu.edu.cn
* Problem#2222
* Accepted
* Time:296ms
* Memory:58152k
*/
#include<iostream>
#include<cstdio>
#include<queue>
#include<cstring>
using namespace std;
#define SEG_SIZE 26
typedef class TrieNode{
public:
TrieNode* next[SEG_SIZE];
TrieNode* fail; //失配指针
TrieNode* last; //后缀链接
int value;
TrieNode():fail(NULL),last(NULL),value(){
memset(next, , sizeof(next));
}
}TrieNode;
typedef class Trie {
public:
TrieNode* root;
Trie(){
root = new TrieNode();
}
static int cti(char ch){ //将字符转换成Trie树中next数组的下标
return ch - 'a';
}
void insert(string s){
TrieNode *p = root;
for(int i = ;i < s.length();i++){
int c = cti(s[i]);
if(p->next[c] == NULL){
TrieNode *newNode = new TrieNode();
p->next[c] = newNode; //链接结点
}
p = p->next[c];
}
p->value++; //用结点的特殊值来存储有多少个单词是在这结尾
}
}Trie;
typedef class AhoMachine{
public:
Trie trie;
int count;
AhoMachine(){
trie = Trie();
count = ;
}
void getFail(){
queue<TrieNode*> que; //以bfs序构造状态转移图
trie.root->fail = trie.root;
for(int i = ;i < SEG_SIZE;i++){
TrieNode* pNode = trie.root->next[i];
if(pNode != NULL){
que.push(pNode);
pNode->fail = trie.root; //根节点的直接子节点的失配指针都是指向根节点
}
}
while(!que.empty()){
TrieNode* p = que.front();
que.pop();
for(int i = ;i < SEG_SIZE;i++){
TrieNode* pNode = p->next[i];
if(pNode == NULL) continue;
que.push(pNode);
TrieNode* pFail = p->fail;
//直到匹配,或者已经指向了根节点
while(pFail != trie.root && pFail->next[i] == NULL) pFail = pFail->fail;
pNode->fail = pFail->next[i];
if(pNode->fail == NULL) pNode->fail = trie.root;
//后缀链接的链接,指向失配后的结点或失配后的结点的后缀链接
pNode->last = (pNode->fail->value != )?(pNode->fail):(pNode->fail->last);
}
}
}
//当匹配完,或者是在一条链的中途仍然可能存在有匹配的结点
void rfind(TrieNode *p){
if(p != NULL){
count += p->value;
rfind(p->last);
p->value = ;
}
}
void find(string s){
TrieNode *pNode = trie.root;
for(int i = ;i < s.length();i++){
int c = Trie::cti(s[i]);
while(pNode != trie.root && pNode->next[c] == NULL) pNode = pNode->fail;
pNode = pNode->next[c];
if(pNode == NULL) pNode = trie.root;
if(pNode->value != ) rfind(pNode); //判断有没有可能匹配完其它的模板
else if(pNode->last != NULL) rfind(pNode->last);
}
}
}AC;
AC *ac;
int cases;
string buf;
int n;
int main(){
ios::sync_with_stdio(false); //取消同步,加快cin读取字符串的速度
cin>>cases;
while(cases--){
ac = new AC();
cin>>n;
for(int i = ;i < n;i++){
cin>>buf;
ac->trie.insert(buf);
}
cin>>buf;
ac->getFail();
ac->find(buf);
cout<<ac->count<<endl;
delete ac;
}
return ;
}

[后记]
  附上自己调程序时所用的数据生成器,如果用随机数生成可能基本上刷个1000,2000组很多问题都不能找出来,
因为直接用随机数要刷出点神数据的概率还是比较低的
 #include<iostream>
#include<fstream>
#include<cstdio>
#include<cstdlib>
#include<ctime>
#include<sstream>
using namespace std;
ofstream fout("ks.in");
//测试数据最少组数
#define CASE_LOW 3
//测试数据最大生成组数(CASE_LOW + CASE_LIMIT - 1)
#define CASE_LIMIT 10
//关键字最小生成组数
#define KEYWORD_LOW 3
#define KEYWORD_LIMIT 10
#define KEYWORD_MAX_LEN 5
//生成文章的次数
#define STR_TIMES 10
#define SUBSTR_LEN 5
string buf[KEYWORD_LIMIT + KEYWORD_LOW];
string str;
int _count;
string operator +(string str, char c){
stringstream ss;
ss<<str<<c;
return ss.str();
}
int main(){ srand((unsigned)time(NULL)); int cases = rand()%CASE_LIMIT + CASE_LOW;
fout<<cases<<endl; for(int i = ;i < cases;i++){ _count = rand()%KEYWORD_LIMIT + KEYWORD_LOW;
fout<<_count<<endl;
for(int j = ; j <= _count;j++){
int len = rand()%KEYWORD_MAX_LEN + ;
buf[j] = "";
for(int k = ; k <= len;k++){
buf[j] = buf[j] + (char)(rand()% + 'a');
}
fout<<buf[j]<<endl;
} int times = rand()%STR_TIMES + ;
str = "";
for(int j = ;j <= times;j++){ int v = rand()%;
if(v == ){
str += buf[rand()%_count + ];
}else{
int len = rand()%SUBSTR_LEN + ;
for(int i = ;i <= len;i++){
str = str + (char)(rand()% + 'a');
}
} } fout<<str<<endl; } fout.close();
return ;
}

md_ks.cpp

hdu 2222 Keywords Search - Aho-Corasick自动机的更多相关文章

  1. HDU 2222 Keywords Search(AC自动机模版题)

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others ...

  2. HDU 2222 Keywords Search(AC自动机模板题)

    http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:给出多个单词,最后再给出一个模式串,求在该模式串中包含了多少个单词. 思路: AC自动机的模板题. ...

  3. HDU 2222 Keywords Search 【AC自动机】

    题目链接:[http://acm.hdu.edu.cn/showproblem.php?pid=2222] 题意:给出很多小字符串,然后给出一个文本串,问文本串中包含多少个小字符串.也就是说如果文本串 ...

  4. HDU 2222 Keywords Search (AC自动机)

    题意:给你一些模式串,再给你一串匹配串,问你在匹配串中出现了多少种模式串,模式串可以相同 AC自动机:trie树上进行KMP.首先模式串建立trie树,再求得失配指针(类似next数组),其作用就是在 ...

  5. HDU 2222 Keywords Search(AC自动机入门)

    题意:给出若干个单词和一段文本,问有多少个单词出现在其中.如果两个单词是相同的,得算两个单词的贡献. 分析:直接就是AC自动机的模板了. 具体见代码: #include <stdio.h> ...

  6. HDU 2222 Keywords Search(AC自动机)题解

    题意:给你几个keywords,再给你一段文章,问你keywords出现了几次. 思路:这里就要用到多模匹配算法AC自动机了,AC自动机需要KMP和字典树的知识,匹配时是在字典树上,失配我们就要用到类 ...

  7. HDU 2222 Keywords Search 【AC自动机模板】

    询问有多少个模式串出现在了文本串里面.将模式串插入Trie树中,然后跑一边AC自动机统计一下就哦了. 献上一份模板. #include <cstdio> #include <cstr ...

  8. hdu 2222 Keywords Search(AC自动机)

    /* 啥也不说了,直接套模板... */ 1 #include<iostream> #include<map> #include<string> #include& ...

  9. HDU 2222 Keywords Search(查询关键字)

    HDU 2222 Keywords Search(查询关键字) Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K ...

  10. hdu 2222 Keywords Search

    链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 思路:裸AC自动机,直接贴代码做模板 #include<stdio.h> #includ ...

随机推荐

  1. Python实现简单HTTP服务器(一)

    一.返回固定内容 # coding:utf-8 import socket from multiprocessing import Process def handle_client(client_s ...

  2. pdb学习笔记

    参考资料:https://segmentfault.com/a/1190000006628456 下一行(不进入函数内部):n(ext) 单步(进入函数内部):s(tep) 打印:p 动态添加断点:1 ...

  3. java.io.File实战

    There are many things that can go wrong: A class works in Unix but doesn't on Windows (or vice versa ...

  4. 【剑指offer】变态跳台阶

    一.题目: 一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级.求该青蛙跳上一个n级的台阶总共有多少种跳法. 二.思路: f(n)=f(n-1)+f(n-2)+...+f(0),f(1) ...

  5. 后缀名htm与html的区别

    前者是超文本标记(Hypertext Markup) 后者是超文本标记语言(Hypertext Markup Language) 可以说 htm = html 同时,这两种都是静态网页文件的扩展名,扩 ...

  6. 在Win7系统下, 使用VS2015 打开带有日文注释程序出现乱码的解决方案

    在Win7系统下, 使用VS2015 打开带有日文注释程序出现乱码的解决方案 下载: apploc.msi (下载地址:http://microsoft-applocale.software.info ...

  7. iOS开发需要学习哪些内容?

    看图:

  8. http协议基础(四)http状态码

    一:http状态码 表示客户端http请求的返回结果.标记服务器端的处理是否正常.通知出现的错误等工作 状态码的类别如下: http状态码种类繁多,大概有60多种,实际上经常使用的只有14种,下面为一 ...

  9. CUDA显卡运算编程菜鸟入门指南1——Hello world - yfszzx的专栏 - 博客频道 - CSDN.NET

    第一次知道有显卡(GPU)编程这个东西,是去年比特币最热门的时候,看了几篇关于比特币的文章,说比特币挖矿要靠显卡,CPU的速度与GPU根本就没法比,于是就非常好奇,显卡是什么神奇的东西?为什么运算速度 ...

  10. css 文本超出容器长度后自动省略的方法!

    我们在给用户显示文本内容的时候,往往需要避免文本内容超出容器宽度,防止换行溢出,小弟在网上找了下发现网上的实现仅仅只是实现了用 ...省略了的功能! 而并没有获取光标提示的功能,所有小弟就结合网上的代 ...