病毒侵袭

HDOJ-2896

  • 主要使用AC自动机解决,其次在query函数中改变一下,用来记录每个模板串出现的次数,还有insert函数中记录模板串的编号
  • 需要注意最好使用结构体,而且不能一次性使用memset否则会超时
  • 上次没有AC出现了output limit exceed问题,后来发现是我的num数组开的太小了,只开了505,实际上需要N的空间。
  • 还有一个问题就是我以前提交的时候很容易就MLE,内存超限,直到我把AC自动机封存到一个结构体中,而且并不是一开始就使用memsettrie树上的结点,而是在建树的时候建一个结点就memset一个结点,这样节省空间。
//AC自动机,复杂度为O(|t|+m),t表示文本串的长度,m表示模板串的个数
#include<iostream>
#include<cstring>
#include<string>
#include<cstdio>
#include<algorithm>
#include<queue>
#include<set>
using namespace std;
const int N=56600;
int n;
string s[502];
set<int>::iterator it;
string t;
struct ACM{
int tree[N][128];//trie树上的结点,tree[i][j]表示i结点后面加一条j的边所对应的的结点
int total;//总结点
int num[N];//num[i]表示结点i上对应的模板串的编号
int fail[N];//失配指针,fail[i]指向所有模板串的前缀中匹配当前状态的最长后缀,指向的是最长后缀(和当前状态的后缀是匹配的,即相同,不过要最长)
int val[N];//val[j]表示结点j所对应的模板串在文本串中出现的次数
set<int> se;
queue<int> q;
void init(){
total=0;
val[0]=fail[0]=num[0]=0;
memset(tree[0],0,sizeof(tree[0]));
}
int idx(char c){//用来求字符c对应的编号(0-25)
return c-0;
}
void insert(string s,int id){//类似于后缀树的插入一个模板串.id表示所有模板串中该模板串的编号
int u=0;
for(int i=0;i<s.length();i++){
if(!tree[u][idx(s[i])])
tree[u][idx(s[i])]=++total;
memset(tree[total],0,sizeof(0));
u=tree[u][idx(s[i])];
}
num[u]=id;
}
void build(){//建AC自动机以及fail数组
for(int i=0;i<128;i++){
if(tree[0][i]){
q.push(tree[0][i]);
fail[tree[0][i]]=0;
}
}
while(!q.empty()){
int u=q.front();
q.pop();
for(int i=0;i<128;i++){
if(tree[u][i]){//如果结点u连的边为i对应的结点存在,则将这个存在的结点的fail指针指向父节点失配指针指向的结点的连的边为i所对应的的结点
fail[tree[u][i]]=tree[fail[u]][i];
q.push(tree[u][i]);
}else{//类似于状态压缩,不至于每次fail指针跳转很多次,只需每次跳转一次,相当于构建了图
tree[u][i]=tree[fail[u]][i];
}
}
}
}
void query(string t){//s为要查找的文本串
se.clear();
int u=0;
int res=0;//记录答案,所有的模板串共出现了多少次
for(int i=0;i<t.length();i++){
u=tree[u][idx(t[i])];
for(int j=u;j>0;){
val[j]++;
j=fail[j];
}
}
for(int i=0;i<=total;i++){//注意:这里是i<=total ,而不是<total,否则报错
if(num[i]){//如果i结点对应着一个模板串,该模板串编号为num[i].
if(val[i]>0){
se.insert(num[i]);//模板串对应的编号插入set中
val[i]=0;
}
}
}
//return res;
}
};
ACM ac;
int main(){
ios::sync_with_stdio(false);
cin.tie(0);
cin>>n;
ac.init();
for(int i=1;i<=n;i++){
cin>>s[i];
ac.insert(s[i],i);
}
ac.build();
int m;
cin>>m;
int ans=0;
for(int i=1;i<=m;i++){
cin>>t;
//memset(val,0,sizeof(val));
ac.query(t);
int size=ac.se.size();
if(size>0){
//cout<<se.size()<<endl;
ans++;
cout<<"web "<<i<<":";
int cnt=0;
for(it=ac.se.begin();it!=ac.se.end();it++){
cout<<" "<<*it;
}
cout<<endl;
}
}
cout<<"total: "<<ans<<endl;
//system("pause");
return 0;
}

HDOJ-2896(AC自动机+文本串中出现了哪几个模板串)的更多相关文章

  1. hdu 2896 AC自动机

    // hdu 2896 AC自动机 // // 题目大意: // // 给你n个短串,然后给你q串长字符串,要求每个长字符串中 // 是否出现短串,出现的短串各是什么 // // 解题思路: // / ...

  2. poj3080Blue Jeans(在m个串中找到这m个串的 最长连续公共子序列)

    Description The Genographic Project is a research partnership between IBM and The National Geographi ...

  3. HDU 2896 (AC自动机模板题)

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=2896 题目大意:多个模式串.多个匹配串.其中串的字符范围是(0~127).问匹配串中含有哪几个模式串 ...

  4. hdu 2896 AC自动机模版题

    题意:输出出现模式串的id,还是用end记录id就可以了. 本题有个关键点:“以上字符串中字符都是ASCII码可见字符(不包括回车).”  -----也就说AC自动机的Trie树需要128个单词分支. ...

  5. POJ 2896 AC自动机 or 暴力

    DESCRIPTION :大意是说.给你n个代表病毒的字符串.m个表示网站的字符串.让你计算有多少个网站被病毒感染了.被那些病毒感染了. 刚开始就想暴力.然而,忽略了条件:每个网站最多有三个病毒.于是 ...

  6. HDU 2087 剪花布条(模式串在主串中出现的次数主串中子串不可重叠)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2087 题意:求模式串在主串中出现的次数,与模式串匹配的子串之间不可重叠. 思路:用kmp算法解决,在匹 ...

  7. HDU 2896 AC自动机 裸题

    中文题题意不再赘述 注意字符范围是可见字符,从32开始到95 char c - 32 #include <stdio.h> #include <string.h> #inclu ...

  8. 【AC自动机】HDU中模板题

    [HDU2222] 最纯粹的裸题,错误点详见注释. #include<iostream> #include<cstdio> #include<cstring> #i ...

  9. 字符串——AC自动机

    目录 一.前言 二.思路 三.代码 四.参考资料 一.前言 以前一直没学AC自动机,主要是被名字吓到了,自动AC,这么强的名字肯定很难,学了后才发现,其实不难. AC自动机并不是Acept autom ...

随机推荐

  1. Alternating Strings Gym - 100712D 简单dp && Alternating Strings II Gym - 100712L 数据结构优化dp

    比赛链接:https://vjudge.net/contest/405905#problem/D 题意: 给你一个长度为n的由0或1构成的串s,你需要切割这个串,要求切割之后的每一个子串长度要小于等于 ...

  2. HihoCoder - 1110

    题意: 您的任务是判断输入是否是合法的正则表达式.正则表达式定义如下: 1: 0和1都是正则表达式. 2:如果P和Q是正则表达式,那么PQ就是正则表达式. 3:如果P是正则表达式,(P)就是正则表达式 ...

  3. c++派生类中构造函数和析构函数执行顺序、判断对象类型、抽象类、虚函数

    一. 代码: 1 #include<stdio.h> 2 #include<string.h> 3 #include<algorithm> 4 #include&l ...

  4. Splits CodeForces - 964A

    题意: 我们定义一个不上升的且和为 n 的正整数序列,叫做 n 的分解. 比如, 下面是8的分解: [4, 4], [3, 3, 2], [2, 2, 1, 1, 1, 1], [5, 2, 1]. ...

  5. Codeforces Round #529 (Div. 3) F. Make It Connected (贪心,最小生成树)

    题意:给你\(n\)个点,每个点都有权值,现在要在这\(n\)个点中连一颗最小树,每两个点连一条边的边权为两个点的点权,现在还另外给了你几条边和边权,求最小权重. 题解:对于刚开始所给的\(n\)个点 ...

  6. GitHub Actions 支持 "skip ci" 了

    GitHub Actions 支持 "skip ci" 了 Intro GitHub Actions 作为 GitHub 官方的 CI 支持,很多开源项目已经在使用 Actions ...

  7. linux无需root挂载iso镜像文件

    引言 起初,我在针对deepin制作一款appimage安装工具,想要其实现的功能就是自动获取图标,只需要输入软件名称和分类即可,当然以后也会寻找方案省去手动输入的麻烦. 后来我发现一个有趣的问题 o ...

  8. 还傻傻分不清楚equals和==的区别吗?看完就明白了

    解决一个问题的最好方法就是发现一个问题产生的根源,即发现最本质的东西,再去解决它. Java语言里面的equals()方法是交给开发者们自己去覆盖重写编写功能的,即让开发者去定义当满足什么条件时,两个 ...

  9. ARMv7-A 架构下的MMU

    ARM架构中MMU的作用主要就是将CPU发出的虚拟地址转换成为物理地址,从实现内核和用户程序和用户程序之间的虚拟地址空间隔离.MMU的主要组成为两部分,其一是内部的TLBs缓存:还有就是转换表装换单元 ...

  10. 101道Numpy、Pandas练习题

    无论是数据分析还是机器学习,数据的预处理必不可少. 其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推 ...