前置芝士:\(Trie\)字典树

这道题,说是AC自动机,实际上一个\(Trie+\)队列轻松搞定。

首先,我们对所有单词建一棵\(Trie\)。

然后,定义一个空队列\(Q\),初始时把\(-1\)放进去(因为字符串下标从\(0\)开始,待会儿详细叙述原因)。

接着,对于每一篇询问的文章\(T\),进行如下操作:

  1. 取出队头元素,假设是\(x\)。
  2. 更新\(ans=\max(ans,x)\)。
  3. 从\(T[x+1]\)开始枚举,进行\(Trie\)上的匹配。(这也解释了为什么刚开始要把\(-1\)放进去,因为这样才能从\(0\)开始枚举)
  4. 如果成功匹配\(T[i]\),继续枚举,直到第\(5\)步被执行或者\(i\ge T.length\)。
  5. 否则,如果发现匹配不了了,立即退出循环,跳回第\(1\)步。
  6. 如果成功匹配\(T[i]\),并且发现这里有字符串结尾标记,则说明成功匹配了一个单词,把\(i\)放进队尾。(注意:此时不能立即退出,待会儿讲原因)
  7. 执行\(1-6\)步,直到队列为空。

说明一下第\(6\)步,此时为什么不能直接退出呢?

比如:词典为\(\{what,whatis\}\),文章为\(whatisbalabala\)。

如果直接退出,则匹配到\(i=3\)时就退出了,最后输出答案为\(4\)。(而实际为\(6\))

这样,就可以开心地\(code\)啦:(看完代码不要心急,继续往下看)

#include <bits/stdc++.h>
using namespace std;
int n,m,trie[1000005][26],tot,c[1000005];
char tmp[1000005];
queue<int> q;
inline void addstring(char a[]){//添加字符串
int len=strlen(a),pos=0;
for(int i=0;i<len;i++){
if(!trie[pos][a[i]-'a']){
trie[pos][a[i]-'a']=++tot;
pos=trie[pos][a[i]-'a'];
}
else pos=trie[pos][a[i]-'a'];
}
c[pos]=true;
}
inline int find(char a[]){
memset(flag,0,sizeof(flag));
int len=strlen(a),pos=0,ans=-1;q.push(-1);
while(!q.empty()){
int x=q.front();q.pop();//步骤1
ans=max(ans,x);pos=0;//步骤2
for(int i=x+1;i<len;i++){//步骤3
if(trie[pos][a[i]-'a']) pos=trie[pos][a[i]-'a'];//步骤4
else break;//步骤5
if(c[pos]) q.push(i);//步骤6
}
}
return ans==-1?0:ans+1;//字符串下标以0开始,而题目中以1开始
}
int main(){
scanf("%d%d",&n,&m);
for(register int i=1;i<=n;i++){
scanf("%s",tmp);addstring(tmp);
}
for(register int i=1;i<=m;i++){
scanf("%s",tmp);printf("%d\n",find(tmp));
}
return 0;
}

开心的交上去,咦?怎么只有\(73pts\)?

经不懈思考,终于构造出能卡掉的数据:

字典:\(\{a,aa,aaa,...,aaaaaaaaaa\}\)

文章:\(\underbrace {aaa...aaa}_{10^6个a}\)

于是,对于几乎每个位置\(x\),都被插入队列至少\(10\)次,速度也就呵呵了......

那么,如何防止一个位置被重复插入?很简单,做个标记就行了。

改进后的代码:\((AC)\)

#include <bits/stdc++.h>
using namespace std;
int n,m,trie[1000005][26],tot,c[1000005],flag[1000005];//flag即为标记数组
char tmp[1000005];
queue<int> q;
inline void addstring(char a[]){
int len=strlen(a),pos=0;
for(int i=0;i<len;i++){
if(!trie[pos][a[i]-'a']){
trie[pos][a[i]-'a']=++tot;
pos=trie[pos][a[i]-'a'];
}
else pos=trie[pos][a[i]-'a'];
}
c[pos]=true;
}
inline int find(char a[]){
memset(flag,0,sizeof(flag));//初始化标记数组
int len=strlen(a),pos=0,ans=-1;q.push(-1);
while(!q.empty()){
int x=q.front();q.pop();
ans=max(ans,x);pos=0;
if(flag[x]) continue;//判断一下该位置是否已经有标记了,如果有就continue
if(x!=-1) flag[x]=1;//否则做个标记
for(int i=x+1;i<len;i++){
if(trie[pos][a[i]-'a']) pos=trie[pos][a[i]-'a'];
else break;
if(c[pos]) q.push(i);
}
}
return ans==-1?0:ans+1;
}
int main(){
scanf("%d%d",&n,&m);
for(register int i=1;i<=n;i++){
scanf("%s",tmp);addstring(tmp);
}
for(register int i=1;i<=m;i++){
scanf("%s",tmp);printf("%d\n",find(tmp));
}
return 0;
}//开心的结束

最后,蒟蒻写博客不易,恳请大佬点个赞!

【Luogu】P2292 [HNOI2004]L语言 题解的更多相关文章

  1. Luogu P2292 [HNOI2004]L语言(Trie+dp)

    P2292 [HNOI2004]L语言 题面 题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章 \(T\) 是由若干小写字母构成. ...

  2. Luogu P2292 [HNOI2004]L语言

    题目链接 \(Click\) \(Here\) 好久没写\(DP\)了真是水平下降不少,一眼把这个题搞成贪心了,然后一发交上只有\(37\)分\(QwQ\) 这个题好像还可以\(AC\)自动机胡搞?不 ...

  3. 洛谷:P2292 [HNOI2004]L语言(DP+Trie树)

    P2292 [HNOI2004]L语言 题目链接:https://www.luogu.org/problemnew/show/P2292 题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有 ...

  4. 2021.11.09 P2292 [HNOI2004]L语言(trie树+AC自动机)

    2021.11.09 P2292 [HNOI2004]L语言(trie树+AC自动机) https://www.luogu.com.cn/problem/P2292 题意: 标点符号的出现晚于文字的出 ...

  5. 洛谷 P2292 [HNOI2004] L语言 解题报告

    P2292 [HNOI2004] L语言 题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章\(T\)是由若干小写字母构成.一个单词 ...

  6. 洛谷(cogs 1293/bzoj 1212) P2292 [HNOI2004]L语言

    1293. [HNOI2004] L语言 ★★★   输入文件:language.in   输出文件:language.out   简单对比时间限制:1 s   内存限制:162 MB [题目描述] ...

  7. P2292 [HNOI2004]L语言

    传送门 思路:  毒瘤的字典树! ▲主要分有两个步骤: ① 日常的建树. ② 暴力地求解. ▲日常建树:过于基础,跳过. ▲重点在于如何暴力地求解而不被卡掉(DP?不存在的) 可以利用区间动规的思想, ...

  8. 洛谷P2292 [HNOI2004]L语言

    传送门 建好trie树 当$dp[j]==1$当且仅当存在$dp[k]=1$且$T[k+1,j]==word[i]$ 然后乱搞就行了 //minamoto #include<iostream&g ...

  9. 洛谷 P2292 [HNOI2004]L语言

    题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的 ...

随机推荐

  1. Layman 使用ffmpeg-php扩展库实现视频截图(默认图)

    这几天做项目,其中一个需求是用户上传视频文件到服务器,然后服务器自动截取该视频的一帧作为该视频对应的缩略图,服务器端语言采用php编写,找了半天资料,发现ffmpeg-php可以满足该需求,所以下面简 ...

  2. matlab中uicontrol创建用户界面控件

    来源:https://ww2.mathworks.cn/help/matlab/ref/uicontrol.html?searchHighlight=uicontrol&s_tid=doc_s ...

  3. 【题解】[USACO07NOV]Sunscreen G

    \(Link\) \(\text{Solution:}\) 把奶牛的忍耐度转化为线段,则题目转化为选择一些点使得覆盖的线段尽可能多.一个点只能覆盖一条线段. 考虑将点按照位置排序,线段按照右端点排序. ...

  4. 一个Java对象的内存布局

    1.对象的创建过程 class loading class linking(verification,preparation,resolution) class initializing 申请对象内存 ...

  5. PropertySheet外壳扩展AppWizard

    下载source files - 39 Kb 下载Wizard - 17 Kb 本文旨在简化属性表外壳扩展的实现.它紧接我的第一篇文章 处理上下文菜单壳扩展和灵感 由Michael Dunn最优秀的系 ...

  6. 使用docker搭建redis服务器记录

    #mkdir /home/redishome#mkdir /home/redishome/data#chmod -R 777 /home/redishome把redis.conf传到/home/red ...

  7. python实现自动生成小学四则运算题目(软工第二次项目作业)

    前言 软件工程 传送带 作业要求 传送带 作业目标 结对编程:代码实现.性能分析.异常处理说明.记录PSP表格 代码见: github 个人信息:朱育清 3118005437 信安二班 我的partn ...

  8. CSS字体属性与文本属性

    CSS字体属性与文本属性 1. 字体属性 1.1 字体系列font-family p { font-family: "Microsoft Yahei";/*微软雅黑*/ } /*当 ...

  9. centos8平台mysql日志的按天切分

    一,mysqladmin使用flush-logs的文档: mysql8官网上面针对mysqladmin的文档地址 https://dev.mysql.com/doc/refman/8.0/en/mys ...

  10. ImageMagick实现图片的旋转/翻转/裁剪(ImageMagick6.9.10)

    一,imagemagick的安装 请参见: https://www.cnblogs.com/architectforest/p/12807514.html 说明:刘宏缔的架构森林是一个专注架构的博客, ...