【poj3693】Maximum repetition substring(后缀数组+RMQ)
题意:给定一个字符串,求重复次数最多的连续重复子串。
传说中的后缀数组神题,蒟蒻真的调了很久才对啊。感觉对后缀数组和RMQ的模版都不是很熟,导致还是会有很多各种各样的小错误= =
首先,枚举重复子串的循环节为L,因为枚举的是循环节长度,所以是没有单调性的,那么枚举就要用0(n)的时间了。连续一次的情况是可以的,所以这里只考虑重复两次或以上的情况。
记这个连续重复子串为L,我们可以发现,这个字符串一定会覆盖s[0],s[L],s[L*2].....这些点中相邻的两个(因为长度至少为2L嘛)。假设它覆盖的是s[L*i]和s[L*(i+1)],那么我们就往前和往后计算能匹配多远(往后匹配用到了后缀数组的height数组,往前匹配可以while到s[L*(i-1)],越过s[L*(i-1)]的情况和前面计算的重复了,可以不算)
记往前匹配和往后匹配的最长长度为k,则重复次数为k/L+1。(如图)

穷举长度L的时间为n,每次计算的时间为n/L。
另外,要在较快的时间内求出以i为开头的后缀和以j为开头的后缀的最长公共前缀要用到RMQ。即快速算出min(height[rank[i]]~height[rank[j]])。用rmq[i][j]表示i~i+(1<<j)-1的min(height),具体如下。

代码如下:
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define Maxn 100100 char s[Maxn];
int a[Maxn],n;
int rank[Maxn],sa[Maxn],Rsort[Maxn],y[Maxn],wr[Maxn];
int height[Maxn],d[Maxn][],ans[Maxn],as[Maxn],al;
int maxx,pos,len; int mymin(int xx,int yy) {return xx<yy?xx:yy;} void get_sa(int m)
{
memcpy(rank,a,sizeof(rank));
for(int i=;i<=m;i++) Rsort[i]=;
for(int i=;i<=n;i++) Rsort[rank[i]]++;
for(int i=;i<=m;i++) Rsort[i]+=Rsort[i-];
for(int i=n;i>=;i--) sa[Rsort[rank[i]]--]=i; int ln=,p=;
while(p<n)
{
int k=;
for(int i=n-ln+;i<=n;i++) y[++k]=i;
for(int i=;i<=n;i++) if(sa[i]>ln) y[++k]=sa[i]-ln;
for(int i=;i<=n;i++) wr[i]=rank[y[i]]; for(int i=;i<=m;i++) Rsort[i]=;
for(int i=;i<=n;i++) Rsort[wr[i]]++;
for(int i=;i<=m;i++) Rsort[i]+=Rsort[i-];
for(int i=n;i>=;i--) sa[Rsort[wr[i]]--]=y[i]; memcpy(wr,rank,sizeof(wr));
p=;rank[sa[]]=;
for(int i=;i<=n;i++)
{
if(wr[sa[i]]!=wr[sa[i-]]||wr[sa[i]+ln]!=wr[sa[i-]+ln]) p++;
rank[sa[i]]=p;
}
m=p,ln*=;
}
sa[]=rank[]=;
} void get_he()
{
int kk=;
for(int i=;i<=n;i++)
{
int j=sa[rank[i]-];
if(kk) kk--;
while(a[i+kk]==a[j+kk]) kk++;
height[rank[i]]=kk;
}
} void rmq_init()
{
for(int i=;i<=n;i++) d[i][]=height[i];
for(int j=;(<<j)<=n;j++)
for(int i=;i+(<<j)-<=n;i++)
d[i][j]=mymin(d[i][j-],d[i+(<<j-)][j-]);
} int rmq(int xx,int yy)
{
int t;
xx=rank[xx],yy=rank[yy];
if(xx>yy) t=xx,xx=yy,yy=t;
xx++;
int kk=;
while((<<(kk+))<=yy-xx+) kk++;
return mymin(d[xx][kk],d[yy-(<<kk)+][kk]);
} void ffind()
{
al=;
maxx=;
for(int i=;i<=n/;i++)
for(int j=;j+i<=n;j+=i)
{
if(a[j]!=a[j+i]) continue;
int kk=rmq(j,j+i),now,r;
now=kk/i+;r=i-kk%i;
//if(now>maxx) maxx=now,ans[al=1]=j,as[al]=i;
//else if(now==maxx) ans[++al]=j,as[al]=i;
int cnt=,p=j;
for(int m=j-;m>j-i&&a[m]==a[m+i]&&m;m--)
{
cnt++;
if(cnt==r) now++,p=m;
else p=rank[p]>rank[m]?m:p;
}
if(now>maxx) maxx=now,pos=p,len=i;
else if(now==maxx&&rank[pos]>rank[p]) pos=p,len=i;
}
} bool cp(int f1,int a1,int f2,int a2)
{
int kk=rmq(f1,f2);
if(kk>=a1-&&kk>=a2-) return a1<=a2?:;
if(kk>=a1-) return ;if(kk>=a2-) return ;
return a[f1+kk]>a[f2+kk];
} int main()
{
int kase=;
while()
{
scanf("%s",s+);
if(s[]=='#') break;
n=strlen(s+);int minn=;
memset(a,,sizeof(a));
for(int i=;i<=n;i++)
{
a[i]=s[i]-'a'+;
minn=mymin(minn,a[i]);
}
get_sa();
get_he();
rmq_init();
ffind();
printf("Case %d: ",++kase);
if(maxx==) printf("%c",minn+'a'-);
else
{
for(int i=pos;i<=pos+len*maxx-;i++) printf("%c",s[i]);
}
printf("\n");
}
return ;
}
poj3693
2015-12-15 17:02:11
【poj3693】Maximum repetition substring(后缀数组+RMQ)的更多相关文章
- poj3693 Maximum repetition substring (后缀数组+rmq)
Description The repetition number of a string is defined as the maximum number R such that the strin ...
- POJ3693 Maximum repetition substring —— 后缀数组 重复次数最多的连续重复子串
题目链接:https://vjudge.net/problem/POJ-3693 Maximum repetition substring Time Limit: 1000MS Memory Li ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ3693 Maximum repetition substring 后缀数组
POJ - 3693 Maximum repetition substring 题意 输入一个串,求重复次数最多的连续重复字串,如果有次数相同的,则输出字典序最小的 Sample input ccab ...
- POJ 3693 Maximum repetition substring (后缀数组+RMQ)
题意:给定一个字符串,求其中一个由循环子串构成且循环次数最多的一个子串,有多个就输出最小字典序的. 析:枚举循环串的长度ll,然后如果它出现了两次,那么它一定会覆盖s[0],s[ll],s[ll*2] ...
- Maximum repetition substring 后缀数组
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 7578 Acc ...
- POJ 3693 Maximum repetition substring ——后缀数组
重复次数最多的字串,我们可以枚举循环节的长度. 然后正反两次LCP,然后发现如果长度%L有剩余的情况时,答案是在一个区间内的. 所以需要找到区间内最小的rk值. 两个后缀数组,四个ST表,$\Thet ...
- 【Poj-3693】Maximum repetition substring 后缀数组 连续重复子串
POJ - 3693 题意 SPOJ - REPEATS的进阶版,在这题的基础上输出字典序最小的重复字串. 思路 跟上题一样,先求出最长的重复次数,在求的过程中顺便纪录最多次数可能的长度. 因为sa数 ...
- poj 3693 Maximum repetition substring (后缀数组)
其实是论文题.. 题意:求一个字符串中,能由单位串repeat得到的子串中,单位串重复次数最多的子串.若有多个重复次数相同的,输出字典序最小的那个. 解题思路:其实跟论文差不多,我看了很久没看懂,后来 ...
- poj3693 Maximum repetition substring
题意 给出一个长度为\(n(n\leqslant 100000)\)的串,求一个字典序最小的子串使得它是某个字符串重复\(k\)次得到的,且\(k\)最大 题解 后缀数组论文上的题,跟上一篇uva那个 ...
随机推荐
- VOL.2 IE6,7,8(windows vista/7 x86/x64 )单文件版三连发,欢迎大家分享
在上期 VOL.1 利用vmware ThinApp 制作非XP下可以运行的IE6 [无插件版](windows vista/7/8 x86/x64 )中,简要介绍了如何利用vmware Thina ...
- 四种方式写按钮点击事件和Android 中常用的布局
1.匿名内部类的方式 2.创建一个类实现onClickListener,实现onClick方法,设置控件点击时传一个类的对象 3.让当前类实现onClickListener,设置控件点击事件时传递一个 ...
- java基础加强
一.泛型 Generic 1.集合泛型: 在没有泛型之前,集合中存入的数据,类型就会丢失掉,在取出数据时,需要做强制类型转换,就有转换失败的风险,而这种风险,在编译阶段是没有办法检查出来的 引入泛型后 ...
- ubuntu安装mariadb
参考网址:https://downloads.mariadb.org/mariadb/repositories/ 以ubuntu12.04安装mariadb10为例.具体其他的可以参考给出的参考网址H ...
- 实体框架(Entity Framework)简介
实体框架(Entity Framework)简介 简称EF,与ADO.NET关系 ADO.NET Entity Framework 是微软以 ADO.NET 为基础所发展出来的对象关系对应 (O/R ...
- 锋利的Jquery解惑系列(二)------插件开发大总结
申明:插件开发是实际项目就经常用到的,不过也是挺吃力的.笔者自己做项目时,看着我们老大写的jQuery一头桨糊,那叫个痛苦.后面果断买了本参考书以及浏览别人的博客,现在也算慢慢入门了.现在总结自己的一 ...
- nginx方面的书籍资料链接
http://tengine.taobao.org/book/ http://blog.sina.com.cn/s/articlelist_1929617884_0_1.html http://blo ...
- [python] virtualenv下解决matplotlib中文乱码
1. 安装中文字体 一般系统自带wqy-microhei,其ttc文件位于/usr/share/fonts/truetype/wqy/wqy-microhei.ttc 2. 将ttc文件复制到pyth ...
- BFC与hasLayout之间的故事
刚拒绝了一个很有诱惑的公司,不是不想去,而是对现在的能力还不确定,希望能够进一步提高自己的技能,所有想写博客了,监督自己的学习进度·········现在还没有开放博客,希望成熟一些后再开放吧! 进入正 ...
- jquery 之效果
// jquery 之效果 .css()既可以获取值,如 .css('fontSize'), 又可以设置内置属性,既可用驼峰式,也可以用连字符版,如 .css('background-color', ...