HDU 2222 Keywords Search(查询关键字)
HDU 2222 Keywords Search(查询关键字)
Time Limit: 2000/1000 MS (Java/Others)
Memory Limit: 131072/131072 K (Java/Others)
【Description】 |
【题目描述】 |
In the modern time, Search engine came into the life of everybody like Google, Baidu, etc. Wiskey also wants to bring this feature to his image retrieval system. Every image have a long description, when users type some keywords to find the image, the system will match the keywords with description of image and show the image which the most keywords be matched. To simplify the problem, giving you a description of image, and some keywords, you should tell me how many keywords will be match. |
当今社会,诸如谷歌,百度等搜索引擎不断深入人心。 Wiskey想把这个功能加入他的图片搜索系统。 每张图都有一串很长的描述,当用户输入一些关键字去搜索图片时,系统会匹配描述图片的关键字并显示有最多关键字匹配的图片。 |
【Input】 |
【输入】 |
First line will contain one integer means how many cases will follow by. Each case will contain one integers N means the number of keywords and N keywords follow. (N <= 10000) Each keyword will only contains characters 'a'-'z', and the length will be not longer than 50. The last line is the description, and the length will be not longer than 1000000. |
第一行有一个整数随后测试用例数量。 每个测试用例。 每个测试用例有一个整数N表示关键字数量与随后有N个关键字。(N <= 10000) 每个关键字只包含字符'a'-'z',并且其长度不大于50。 最后一行是此图片的描述,并且其长度不大于1000000。 |
【Output】 |
【输出】 |
Print how many keywords are contained in the description. |
输出描述中包含的关键字数量。 |
【Sample Input - 输入样例】 |
【Sample Output - 输出样例】 |
1 5 she he say shr her yasherhs |
3 |
【题解】
AC自动机入门题,不过数据不全面,里面没有考虑回头匹配子串情况的数据(个人觉得这是KMP的AC自动机的主要不同之处,Trie图不会,哪天被打脸了再说)
例如:
1
2
abc
b
abc
输出1的代码居然也能A……而且貌似这个问题被提出来很久了,一直没有改善。
注意匹配的是关键字数量,关键字可以相同,不过可以看成匹配一个关键字就去掉一个关键字。
【代码 C++】
#include <cstdio>
#include <cstring>
#include <queue>
struct Node{
int next[], fail, isWord;
}tr[];
int it;
char text[]; void build(){
it = ;
memset(tr, , sizeof(tr));
int n, i, j, w;
char word[];
scanf("%d", &n), getchar();
while (n--){
gets(word);
for (i = j = ; word[i]; ++i){
w = word[i] - 'a';
if (!tr[j].next[w]) tr[j].next[w] = ++it;
j = tr[j].next[w];
}
++tr[j].isWord;
}
}
void setFail(){
std::queue<int> q, last;
int now, pre, next, i, j;
for (i = ; i < ; ++i){
if (tr[].next[i]) q.push(tr[].next[i]), last.push();
} while (!q.empty()){
now = q.front(); q.pop();
pre = last.front(); last.pop();
for (i = ; i < ; ++i){
next = tr[now].next[i];
if (next){
q.push(next);
if (tr[pre].next[i]) j = pre;
else j = ;
if (tr[j].next[i]){
tr[next].fail = tr[j].next[i];
last.push(tr[j].next[i]);
}
else last.push();
}
}
}
}
int fid(){
gets(text);
int i, iTR, opt, w, temp;
for (i = iTR = opt = ; text[i]; ++i){
w = text[i] - 'a';
if (tr[iTR].next[w]) iTR = tr[iTR].next[w];
else{
if (iTR) --i;
iTR = tr[iTR].fail;
}
for (temp = iTR; ~tr[temp].isWord; temp = tr[temp].fail){
opt += tr[temp].isWord;
tr[temp].isWord = -;
}
}
return opt;
}
int main(){
int t;
scanf("%d", &t);
while (t--){
build();
setFail();
printf("%d\n", fid());
}
return ;
}
自己面向图片编程的代码……
#include <cstdio>
#include <cstring>
#include <queue>
struct Node{
int next[], fail, isWord;
}tr[];
int it; void build(){
it = ;
memset(tr, , sizeof(tr));
int n, i, j, w;
char word[];
scanf("%d", &n), getchar();
while (n--){
gets(word);
for (i = j = ; word[i]; ++i){
w = word[i] - 'a';
if (!tr[j].next[w]) tr[j].next[w] = ++it;
j = tr[j].next[w];
}
++tr[j].isWord;
}
}
void setFail(){
std::queue<int> q;
int now, next, i;
for (i = ; i < ; ++i) if (tr[].next[i]) q.push(tr[].next[i]); while (!q.empty()){
now = q.front(); q.pop();
for (i = ; i < ; ++i){
if (next = tr[now].next[i]){
q.push(next);
tr[next].fail = tr[tr[now].fail].next[i];
}
else tr[now].next[i] = tr[tr[now].fail].next[i];
}
}
}
int fid(){
char text[];
gets(text);
int i, iTR, opt, temp;
for (i = iTR = opt = ; text[i]; ++i){
iTR = tr[iTR].next[text[i] - 'a'];
for (temp = iTR; ~tr[temp].isWord; temp = tr[temp].fail){
opt += tr[temp].isWord;
tr[temp].isWord = -;
}
}
return opt;
}
int main(){
int t;
scanf("%d", &t);
while (t--){
build();
setFail();
printf("%d\n", fid());
}
return ;
}
参考kuangbin巨后稍微简化的代码
HDU 2222 Keywords Search(查询关键字)的更多相关文章
- HDU 2222 Keywords Search(AC自动机模版题)
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others ...
- HDU 2222 Keywords Search(瞎搞)
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others ...
- hdu 2222 Keywords Search ac自己主动机
点击打开链接题目链接 Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Ja ...
- hdu 2222 Keywords Search 模板题
Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others ...
- hdu 2222 Keywords Search - Aho-Corasick自动机
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)Total Submissio ...
- hdu 2222 Keywords Search ac自动机入门
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串. ...
- hdu 2222 Keywords Search
链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 思路:裸AC自动机,直接贴代码做模板 #include<stdio.h> #includ ...
- HDU 2222 Keywords Search(AC自动机模板题)
http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:给出多个单词,最后再给出一个模式串,求在该模式串中包含了多少个单词. 思路: AC自动机的模板题. ...
- 【刷题】HDU 2222 Keywords Search
Problem Description In the modern time, Search engine came into the life of everybody like Google, B ...
随机推荐
- android 学习随笔十三(网络:多线程下载)
多线程断点续传下载1.多线程:快* 原理:抢占服务器资源* 单线程下载:线程从第0个字节开始下,下到最后一个字节,在本地硬盘的临时文件中从第0个字节开始写,写到最后一个字节,下载完成时,临时文件也写完 ...
- 5.24 Declaring Attributes of Functions【转】
转自:https://gcc.gnu.org/onlinedocs/gcc-4.0.0/gcc/Function-Attributes.html 5.24 Declaring Attributes o ...
- [转]JEXUS的高级配置
转自:http://www.cnblogs.com/xiaodiejinghong/archive/2013/04/14/3019660.html 前一回合,我们对服务器软件Jexus作了简单的介绍, ...
- log4j里面的info,debug,error级别有什么区别
一共分为五个级别:DEBUG.INFO.WARN.ERROR和FATAL.这五个级别是有顺序的,DEBUG < INFO < WARN < ERROR < FATAL,明白这一 ...
- PHP最原始的上传文件函数
<?php $upload_file=$_FILES['upload_file']['tmp_name']; $upload_file_name=$_FILES['upload_file'][' ...
- RAC例子
我个人非常推崇ReactiveCocoa,它就像中国的太极,太极生两仪,两仪生四象,四象生八卦,八卦生万物.ReactiveCocoa是一个高度抽象的编程框架,它真的很抽象,初看你不知道它是要干嘛的, ...
- CSS 学习质料
1.学习CSS布局 http://zh.learnlayout.com/display.html
- PHP gmdate() 函数
定义和用法 gmdate() 函数格式化 GMT/UTC 日期/时间. 同 date() 函数 类似,不同的是返回的时间是格林威治标准时(GMT). 语法 gmdate(format,timestam ...
- Android中的图片压缩
1.android中计算图片占用堆内存的kB大小跟图片本身的kB大小无关,而是根据图片的尺寸来计算的. 比如一张 480*320大小的图片占用的堆内存大小为: 480*320*4/1024=600kB ...
- 在javaEE下学习web(在eclipse中开发动态的WEB工程,servlet的环境搭建,及servlet的一些方法)
一个简便的方法实现javaee版的eclipse开发动态的WEB工程(javaWEB项目)1.把开发选项切换到javaEE2. 可以在window->shou view 中找到package e ...