bzoj 2806: [Ctsc2012]Cheat 后缀自动机DP
2806: [Ctsc2012]Cheat
Time Limit: 20 Sec Memory Limit: 256 MB
Submit: 583 Solved: 330
[Submit][Status][Discuss]
Description


Input
第一行两个整数N,M表示待检查的作文数量,和小强的标准作文库
的行数
接下来M行的01串,表示标准作文库
接下来N行的01串,表示N篇作文
Output
N行,每行一个整数,表示这篇作文的Lo 值。
Sample Input
10110
000001110
1011001100
Sample Output
HINT
输入文件不超过1100000字节
注意:题目有改动,可识别的长度不小于90%即可,而不是大于90%
先将作文库建后缀自动机,多篇文章可以通过在中间加入分隔符来完成。对于每组询问,预处理出每一个位置向前最多匹配多长g[]。
二分答案len,dp[]表示匹配到当前位置的最多匹配数,对于i位置,dp[i]由一段通过len,与g确定出的区间[l,r]转移,本来用了一个线段树维护,但是由于时间复杂度O(n*log^2n),TLE了,观察发现[l,r]是单调的,故可直接用单调队列。
网上一半题解过不了数据:1 1 1 1
另外,对于0.9的问题确实说明了以后能用int就不要用double,实在不行要加eps。
省选前最后一题了,真觉得时间过得太快了。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
#define MAXN 4100000
#define MAXT MAXN*4
#define INF 0x3f3f3f3f
#define lch (now<<1)
#define rch (now<<1^1)
#define smid ((l+r)>>1)
char buf[MAXN];
char *bufnow(buf);
int len[MAXN];
char *str[MAXN];
char buf2[MAXN];
char *bufnow2(buf2);
struct sam_node
{
int nxt[];
int pnt,len;
void Print()
{
for (int i=;i<;i++)
printf("%d[%d] ",i,nxt[i]);
printf("\n");
printf("Pnt:%d\n",pnt);
}
}sam[MAXN];
int tops=;
int last=;
void Add_item(int w)
{
int p=last;
int np=++tops;
sam[np].len=sam[p].len+;
while (p && !sam[p].nxt[w])
sam[p].nxt[w]=np,p=sam[p].pnt;
if (!p)
{
last=np;
sam[np].pnt=;
}else
{
int q=sam[p].nxt[w];
if (sam[p].len+==sam[q].len)
{
sam[np].pnt=q;
}else
{
int nq=++tops;
sam[nq]=sam[q];
sam[nq].len=sam[p].len+;
sam[nq].pnt=sam[q].pnt;
sam[q].pnt=nq;
sam[np].pnt=nq;
while (p && sam[p].nxt[w]==q)
{
sam[p].nxt[w]=nq;
p=sam[p].pnt;
}
}
}
last=np;
}
int g[MAXN];
int dp[MAXN];
int seq[MAXN]; int main()
{
freopen("input.txt","r",stdin);
int n,m;
int x,y;
scanf("%d%d\n",&n,&m);
for (int i=;i<m;i++)
{
scanf("%s\n",bufnow2);
bufnow2+=strlen(bufnow2);
*(bufnow2++)='';
}
for (int i=;i<n;i++)
{
scanf("%s\n",bufnow);
str[i]=bufnow;
bufnow+=len[i]=strlen(bufnow);
bufnow++;
}
for (char *i=buf2;i!=bufnow2;i++)
{
Add_item(*i-'');
}
for (int i=;i<=tops;i++)
{
// printf("SAM<%d>:\n",i);
// sam[i].Print();
}
for (int i=;i<n;i++)
{
int now=;
int clen=;
for (int j=;j<len[i];j++)
{
int w=str[i][j]-'';
if (sam[now].nxt[w])
{
now=sam[now].nxt[w];
clen++;
}else
{
while (now && !sam[now].nxt[w])
now=sam[now].pnt;
if (!now)
{
now=;
clen=;
}else
{
clen=sam[now].len+;
now=sam[now].nxt[w];
}
}
g[j]=clen;
// printf("%d\n",clen);
}
for (int j=len[i];j>=;j--)
g[j]=g[j-];
g[]=;
int l=,r=len[i]+;
int mid;
int head,tail=;
int ny;
while (l+<r)
{
mid=(l+r)>>;
int t;
for (int j=;j<=len[i];j++)
dp[j]=-INF;
dp[]=;
head=,tail=-;
ny=;
for (int j=;j<=len[i];j++)
{
x=j-g[j];
y=j-mid;
while (ny<=y)
{
while (head<=tail && dp[seq[tail]]<=dp[ny])
tail--;
seq[++tail]=ny++;
}
while (head<=tail && seq[head]<x)
head++;
dp[j]=dp[j-]+(j-);
if (head<=tail)
dp[j]=max(dp[j],dp[seq[head]]+j);
dp[j]-=j;
}
t=dp[len[i]]+len[i];
if (t*>=len[i]*)
l=mid;
else
r=mid;
}
printf("%d\n",l);
}
}
bzoj 2806: [Ctsc2012]Cheat 后缀自动机DP的更多相关文章
- BZOJ 2806 [Ctsc2012]Cheat ——后缀自动机 单调队列优化DP
先建出广义后缀自动机. 然后跑出文章中每一个位置的最大匹配距离. 然后定义$f[i]$表示匹配到以$i$结尾的串时,最长的匹配距离. 显然可以二分$L$的取值. 然后容易得到$DP$方程 $f[i]= ...
- BZOJ 2806 [Ctsc2012]Cheat (后缀自动机+二分+单调队列+dp)
题目大意: 给你一堆模式串和文本串 对于每个文本串,我们可以把它不可重叠地拆分成很多子串,如果拆分出的串作为子串出现在了任何一个模式串中,我们称它是“眼熟的”,我们必须保证“眼熟的”子串总长度不小于文 ...
- BZOJ 2806: [Ctsc2012]Cheat [广义后缀自动机 单调队列优化DP 二分]
2806: [Ctsc2012]Cheat 题意: 多个主串和多个询问串,每次询问将询问串分成多个连续子串,如果一个子串长度>=L且在主串中出现过就是熟悉的 如果熟悉的字符串长度>=询问串 ...
- [bzoj2806][Ctsc2012]Cheat(后缀自动机(SAM)+二分答案+单调队列优化dp)
偷懒直接把bzoj的网页内容ctrlcv过来了 2806: [Ctsc2012]Cheat Time Limit: 20 Sec Memory Limit: 256 MBSubmit: 1943 ...
- BZOJ 2806: [Ctsc2012]Cheat(单调队列优化dp+后缀自动机)
传送门 解题思路 肯定先要建出来广义后缀自动机.刚开始以为是个二分+贪心,写了一下结果\(20\)分.说一下正解,首先显然\(L_0\)具有单调性,是可以二分的.考虑二分后怎样判合法,对于分割序列很容 ...
- bzoj 2806 [Ctsc2012]Cheat——广义后缀自动机+单调队列优化DP
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=2806 只想着怎么用后缀数据结构做,其实应该考虑结合其他算法. 可以二分那个长度 L .设当前 ...
- BZOJ.2806.[CTSC2012]Cheat(广义后缀自动机 DP 单调队列)
题目链接 首先二分答案L.然后就是判断能否将原串划分出一些长度不小于L的子串,这些子串要是给定n个串中的某个串的子串,且满足它们的长度之和不小于原串长度的90%. 贪心多长选一段什么的显然不对.老老实 ...
- bzoj 2806: [Ctsc2012]Cheat【广义SAM+二分+dp+单调队列】
把模板串建一个广义SAM 然后在线查询,每次在SAM上预处理出一个a[i]表示i位置向前最多能匹配多长的模板串 二分答案L,dp判断,设f[i]为·~i有几个匹配,转移显然是f[i]=max{f[i- ...
- bzoj 2806: [Ctsc2012]Cheat
传送门 好久没刷bzoj惹…… 题意不说可以嘛. 首先二分答案. SAM的事情搞完以后就是dp辣. 我们已经对于每个位置i,找到了最小的一个k,使得[k,i]这个子串在模版串中出现过.那么我们需要做的 ...
随机推荐
- 从cmd中进入MySQL的命令界面
两种方式进入mysql命令界面 第一.直接开始界面→搜索mysql客户端登陆界面 第二.从cmd中进入MySQL的命令界面 2010-05-17 10:02:05| 分类: mysql|字号 订阅 ...
- HD1285(拓扑排序)
package cn.hncu.dataStruct.search.topSort; import java.util.Scanner; public class Hdu1285 { static S ...
- css图片垂直居中
css图片垂直居中一.style代码 .case-pic{ height: 125px; position: relative; text-align: center } .case-pic span ...
- Android_Intent_passObject
方法4. 把基本的数据类型封装到一个对象中,然后通过intent传递该对象需要考虑对Person对象进行序列化 MainActivity: package com.example.day06_acti ...
- 百度编辑器umeditor使用总结
百度编辑器是一个功能很全.很强大. 百度单张图片上传只能存储在项目下面,而不能独立自定义存储位置,因此重写上传代码 百度文章中的图片是通过base64实现的,直接存储在数据库中 tomcat通过虚拟路 ...
- 腾讯海量数据处理平台TDW
TDW是腾讯海量数据处理平台中最核心的模块,它有以下几个作用: 提供海量的离线计算和存储服务.TDW是腾讯内部规模最大的离线数据处理平台,公司内大多数业务的产品报表.运营分析.数据挖掘等的存储和计算都 ...
- cmd命令积累
dir:展示所有目录 cd fileName:进入下一个目录 cd .. :返回上一层目录 cd\:返回根目录
- [转]SQL语句:Group By总结
1. Group By 语句简介: Group By语句从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”.它的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若 ...
- ios专题 -内存管理 研究
[原创]http://www.cnblogs.com/luoguoqiang1985 ARC [新的规则] 1. you cannot explicitly invoke dealloc, or im ...
- JavaScript 学习笔记-- ES6学习(一)介绍以及Babel的使用
本文摘自阮一峰老师的<ECMAScript 6入门>,原文地址:http://es6.ruanyifeng.com/#docs/intro ECMAScript 6 是一个泛指,含义是5. ...