http://www.lydsy.com/JudgeOnline/problem.php?id=2806 (题目链接)

题意

  给出M个字符串组成“标准库”。定义L表示将一个字符串分成若干段,每一段的长度不小于L,其中是在标准库中任一字符串的子串的字符“段”的长度之和不小于原字符串长度之和的90%。N个询问,每个给出一个字符串,求其满足条件的最大的L。

Solution

  对于每一个询问,我们在线做,话说离线怎么做,整体二分吗→_→

  很显然,这应该是要二分答案,考虑怎么check。我们想到了dp:${f_i}$表示后缀${i}$的最长覆盖长度。

$${f_{i}=Max\{f_{i+1},f_j+j-i\},i+L_0<=j<=R_i+i}$$

  其中${L_0}$表示当前二分的答案,${R_i}$表示从第${i}$位开始能够匹配到的最长的连续段长度。注意这个要倒着做→_→

  然而这个dp是${O(n^2)}$的,我们还需要优化,加上一个括号:

$${f_i=Max\{f_{i+1},(f_j+j)-i\},i+L_0<=j<=R_i+i}$$

  于是${f_j+j}$就只与${j}$有关了,我们考虑单调队列。如果队首因为它的位置${>=R_i+i}$而被踢出了队列,那么它必然不会因为后面串的${R_i}$长度增大而被加回来,因为每往后面挪一格长度只可能+1,然后又因为i会-1,所以就是不变的。

  那么我们就可以${O(nlogn)}$的求解每一个询问了。

  那么只剩下一个问题,${R_i}$怎么求。考虑后缀数组。将所有串接在一起,求一个后缀数组,然后求出height,那么如果一个后缀是询问串的后缀,与其最近的“标准库”中的后缀的height就是它的${R_i}$。然后倍增构后缀数组就TLE飞了→_→,等下补一发后缀自动机的。

  UPD 2017.1.19:

  这几天一直在考试,拖到了现在。原来就是把“标准库”中的串用分隔符接起来构后缀自动机,之后每一个询问串在上面跑匹配就可以轻松的求出${R_i}$了,我还写了发后缀自动机构后缀数组,然而分隔符太大了,开不下→_→。

  因为之前的dp是倒着求的,所以这里的后缀自动机和匹配都是倒着来的→_→,懒得再去改dp和二分答案了。。

细节

  构造后缀数组时桶的大小要注意;求${R_i}$的时候要想清楚→_→。

  后缀自动机匹配的时候长度要随着匹配失败跳parent树的移动而改变。

代码(后缀数组)

// bzoj2806
#include<algorithm>
#include<iostream>
#include<cstdlib>
#include<cstring>
#include<vector>
#include<cstdio>
#include<cmath>
#include<ctime>
#define LL long long
#define inf 1<<30
#define Pi acos(-1.0)
#define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);
using namespace std; const int maxn=2000010;
int f[maxn],S[maxn],a[maxn],vis[maxn],q[maxn],pl[maxn],pr[maxn],R[maxn];
int rank[maxn],sa[maxn],height[maxn];
char s[maxn];
int n,m,ans; namespace Suffix {
int wa[maxn],wb[maxn],ww[maxn];
bool cmp(int *r,int a,int b,int l) {
return r[a]==r[b] && r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m) {
int i,j,p,*x=wa,*y=wb;
for (i=0;i<=m;i++) ww[i]=0;
for (i=1;i<=n;i++) ww[x[i]=r[i]]++;
for (i=1;i<=m;i++) ww[i]+=ww[i-1];
for (i=n;i>=1;i--) sa[ww[x[i]]--]=i;
for (p=0,j=1;p<n;j*=2,m=p) {
for (p=0,i=n-j+1;i<=n;i++) y[++p]=i;
for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j;
for (i=0;i<=m;i++) ww[i]=0;
for (i=1;i<=n;i++) ww[x[y[i]]]++;
for (i=1;i<=m;i++) ww[i]+=ww[i-1];
for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i];
for (swap(x,y),p=x[sa[1]]=1,i=2;i<=n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p;
}
}
void calheight(int *r,int *sa,int n) {
for (int i=1;i<=n;i++) rank[sa[i]]=i;
for (int k=0,i=1;i<=n;i++) {
if (k) k--;
int j=sa[rank[i]-1];
while (r[i+k]==r[j+k]) k++;
height[rank[i]]=k;
}
}
}
using namespace Suffix; bool dp(int x,int L0) {
for (int i=pl[x];i<=pr[x];i++) f[i]=0;
int l=1,r=1;q[1]=pr[x]+1;
for (int i=pr[x]-L0+1;i>=pl[x];i--) {
while (l<=r && q[l]>i+R[i]) l++;
f[i]=f[i+1];
if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i);
if (i+L0-1<=pr[x]) {
while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--;
q[++r]=i+L0-1;
}
}
return 10*f[pl[x]]>=(pr[x]-pl[x]+1)*9;
}
int main() {
scanf("%d%d",&n,&m);
int len=0;S[0]=inf;
for (int i=1;i<=m;i++) {
scanf("%s",s+1);
for (int j=1;j<=strlen(s+1);j++) S[++len]=s[j]-'0';
S[++len]=i+2;
}
for (int i=1;i<=n;i++) {
scanf("%s",s+1);
int tmp=strlen(s+1);
pl[i]=len+1;
for (int j=1;j<=tmp;j++) S[++len]=s[j]-'0',vis[len]=1;
pr[i]=len;
S[++len]=i+m+2;
}
da(S,sa,len,1000000);
calheight(S,sa,len);
for (int l=inf,i=2;i<=len;i++) {
if (i==2) while (vis[sa[i-1]] && vis[sa[i]] && i<=len) i++;
if (!vis[sa[i]]) l=inf;
else {
l=min(l,height[i]);
R[sa[i]]=max(R[sa[i]],l);
}
}
for (int l=inf,i=len-1;i>=1;i--) {
if (i==len-1) while (vis[sa[i+1]] && vis[sa[i]] && i>=1) i--;
if (!vis[sa[i]]) l=inf;
else {
l=min(l,height[i+1]);
R[sa[i]]=max(R[sa[i]],l);
}
}
for (int i=1;i<=n;i++) {
int l=0,r=pr[i]-pl[i]+1,ans=0;
while (l<=r) {
int mid=(l+r)>>1;
if (dp(i,mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d\n",ans);
}
return 0;
}

代码(后缀自动机)

// bzoj2806
#include<algorithm>
#include<iostream>
#include<cstdlib>
#include<cstring>
#include<vector>
#include<cstdio>
#include<cmath>
#include<ctime>
#define LL long long
#define inf 1<<30
#define Pi acos(-1.0)
#define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);
using namespace std; const int maxn=2000010;
int f[maxn],q[maxn],R[maxn];
char s[maxn];
int n,m,N,ans; namespace SAM {
int par[maxn<<1],len[maxn<<1],pos[maxn<<1],ch[maxn>>1][10];
int last,Dargen,sz; void Extend(int c) {
int np=++sz,p=last;last=np;
len[np]=len[p]+1;
for (;p && !ch[p][c];p=par[p]) ch[p][c]=np;
if (!p) par[np]=Dargen;
else {
int q=ch[p][c];
if (len[p]+1==len[q]) par[np]=q;
else {
int nq=++sz;len[nq]=len[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
par[nq]=par[q];
par[np]=par[q]=nq;
for (;p && ch[p][c]==q;p=par[p]) ch[p][c]=nq;
}
}
}
void match() {
int ll=0;
for (int p=Dargen,i=n;i>=1;i--) {
while (p>1 && !ch[p][s[i]-'0']) p=par[p],ll=len[p];
if (ch[p][s[i]-'0']) p=ch[p][s[i]-'0'],ll++;
else ll=0;
R[i]=ll;
}
}
}
using namespace SAM; bool dp(int x,int L0) {
for (int i=1;i<=n+1;i++) f[i]=0;
int l=1,r=1;q[1]=n+1;
for (int i=n-L0+1;i>=1;i--) {
while (l<=r && q[l]>i+R[i]) l++;
f[i]=f[i+1];
if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i);
if (i+L0-1<=n) {
while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--;
q[++r]=i+L0-1;
}
}
return 10*f[1]>=n*9;
}
int main() {
scanf("%d%d",&N,&m);
SAM::sz=SAM::Dargen=SAM::last=1;
for (int i=1;i<=m;i++) {
scanf("%s",s+1);
for (int i=strlen(s+1);i>=1;i--) Extend(s[i]-'0');
Extend(2);
}
for (int i=1;i<=N;i++) {
scanf("%s",s+1);
n=strlen(s+1);
match();
int l=0,r=n,ans=0;
while (l<=r) {
int mid=(l+r)>>1;
if (dp(i,mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d\n",ans);
}
return 0;
}

【bzoj2806】 Ctsc2012—Cheat的更多相关文章

  1. 【BZOJ2806】[Ctsc2012]Cheat 广义后缀自动机+二分+单调队列优化DP

    [BZOJ2806][Ctsc2012]Cheat Description Input 第一行两个整数N,M表示待检查的作文数量,和小强的标准作文库的行数接下来M行的01串,表示标准作文库接下来N行的 ...

  2. 【BZOJ2806】Cheat(后缀自动机,二分答案,动态规划,单调队列)

    [BZOJ2806]Cheat(后缀自动机,二分答案,动态规划,单调队列) 题面 BZOJ 洛谷 题解 很有趣的一道题啊 对于在所有的串上面进行匹配? 很明显的后缀自动机 所以先构建出广义后缀自动机 ...

  3. 【BZOJ2806】【CTSC2012】Cheat 广义后缀自动机+二分+Dp

    题目 题目在这里 思路&做法 我们先对标准作文库建广义后缀自动机. 然后对于每一篇阿米巴的作文, 我们首先把放到广义后缀自动机跑一遍, 对于每一个位置, 记录公共子串的长度\((\)即代码和下 ...

  4. 【BZOJ2806】【CTSC2012】Cheat - 广义后缀自动机+单调队列优化DP

    题意: Description Input 第一行两个整数N,M表示待检查的作文数量,和小强的标准作文库的行数 接下来M行的01串,表示标准作文库 接下来N行的01串,表示N篇作文 Output N行 ...

  5. 【BZOJ2806】Cheat 【广义后缀自动机+单调队列优化dp+二分】

    题意 有M篇标准作文组成了一个作文库(每篇作文都是一个01的字符串),然后给出N篇作文(自然也是01字符串).如果一个长度不小于L的串在作文库中出现过,那么它是熟悉的.对于某一篇作文,我们要把它分为若 ...

  6. 【Gerrit】Performance Cheat Sheet

    首先说下做这件事情的主因,组内有人说Project repo sync有点慢,废话不多说,直接上图. 相关官方文档参考链接: 我的数据: ~/review_site/logs# fgrep " ...

  7. BZOJ2806 [Ctsc2012]Cheat 【后缀自动机 + 二分 + 单调队列优化DP】

    题目 输入格式 第一行两个整数N,M表示待检查的作文数量,和小强的标准作文库 的行数 接下来M行的01串,表示标准作文库 接下来N行的01串,表示N篇作文 输出格式 N行,每行一个整数,表示这篇作文的 ...

  8. 【BZOJ 2806】 2806: [Ctsc2012]Cheat (SAM+二分+DP+单调队列)

    2806: [Ctsc2012]Cheat Time Limit: 20 Sec  Memory Limit: 256 MBSubmit: 1262  Solved: 643 Description ...

  9. [bzoj2806][Ctsc2012]Cheat(后缀自动机(SAM)+二分答案+单调队列优化dp)

    偷懒直接把bzoj的网页内容ctrlcv过来了 2806: [Ctsc2012]Cheat Time Limit: 20 Sec  Memory Limit: 256 MBSubmit: 1943   ...

随机推荐

  1. Hadoop源码阅读环境搭建(IDEA)

    拿到一份Hadoop源码之后,经常关注的两件事情就是 1.怎么阅读?涉及IDEA和Eclipse工程搭建.IDEA搭建,选择源码,逐步导入即可:Eclipse可以选择后台生成工程,也可以选择IDE导入 ...

  2. 高可用OpenStack(Queen版)集群-15.Glance&Cinder集成Ceph

    参考文档: Install-guide:https://docs.openstack.org/install-guide/ OpenStack High Availability Guide:http ...

  3. SparkRDD编程实战

    通过spark实现点击流日志分析案例 1. 访问的pv package cn.itcast import org.apache.spark.rdd.RDD import org.apache.spar ...

  4. [Github] Github使用教程

    前言 Github是一个面向开源及私有软件项目的托管平台.它可以免费使用,并且速度快速,拥有超多的用户.是目前管理软件开发和发现已有代码的首选平台.下面将向Github新手介绍相关操作. 正文 注册 ...

  5. [持久更新] 剑指offer题目Python做题记录

    第一题 题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. 思路:先快速定位到 ...

  6. ES6的新特性(23)——ArrayBuffer

    ArrayBuffer ArrayBuffer对象.TypedArray视图和DataView视图是 JavaScript 操作二进制数据的一个接口.这些对象早就存在,属于独立的规格(2011 年 2 ...

  7. 查询数据库时mapper报错:It's likely that neither a Result Type nor a Result Map was specified.

    因为mapper.xml里把resultType写成了parameterType

  8. cnblogs.com用户体验

    一.是否提供了良好的体验给用户(同时提供价值)? 首先我觉得博客园给我们这些用户提供了良好的用户体验,博客园提供了一个纯净的技术交流空间,在这里我们可以找到几乎所有与IT技术有关的博文,而且可以在这里 ...

  9. 《Spring1之第五次站立会议》

    <第五次站立会议> 昨天:试着做了一下主框架里的在线人数的显示代码: 今天:向小伙伴们请教了我代码的错误的解决方法以及对TCP/IP协议进行了相关的了解. 遇到的问题:虽然基本原理不难理解 ...

  10. HDU 4281 Judges' response 状压dp+多旅行商问题

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4281 Judges' response Time Limit: 2000/1000 MS (Java ...