Maximum repetition substring
Time Limit: 1000MS   Memory Limit: 65536K
Total Submissions: 9458   Accepted: 2915

Description

The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same consecutive substrings. For example, the repetition number of "ababab" is 3 and "ababa" is 1.

Given a string containing lowercase letters, you are to find a substring of it with maximum repetition number.

Input

The input consists of multiple test cases. Each test case contains exactly one line, which
gives a non-empty string consisting of lowercase letters. The length of the string will not be greater than 100,000.

The last test case is followed by a line containing a '#'.

Output

For each test case, print a line containing the test case number( beginning with 1) followed by the substring of maximum repetition number. If there are multiple substrings of maximum repetition number, print the lexicographically smallest one.

Sample Input

ccabababc
daabbccaa
#

Sample Output

Case 1: ababab
Case 2: aa

Source


[2016-12-29 00:26]
从20点写(照代码抄)到现在....
不想写思路了,看论文吧,那么
整理一下调试过程的问题:
STL:
reverse(s+1,s+1+n) 第一个别写成s
ST表中:
1.预处理Log的话是N不是n..........silly
2.一定要写好了,i和j分清了别顺手写错,找好久还不知道问题出在哪
SA:
1.写了个调试函数test.....
2.通常不需要memset什么,注意重设m的范围吧
 
4个多小时不太值啊,不过也算是对后缀数组有了点感觉了吧,明天再写两道这样的题
现在什么错误都不要紧,省选时不要犯就好
 
[2016-12-29 12:36:21]
补一下做法:

重复次数最多的连续重复子串

论文:

先穷举长度 L,然后求长度为 L 的子串最多能连续出现几次。首先连续出现1 次是肯定可以的,所以这里只考虑至少 2 次的情况。假设在原字符串中连续出 现 2 次,记这个子字符串为 S,那么 S 肯定包括了字符 r[0], r[L], r[L*2], r[L*3], ......中的某相邻的两个。所以只须看字符 r[L*i]和 r[L*(i+1)]往前和 往后各能匹配到多远,记这个总长度为 K,那么这里连续出现了 K/L+1 次。最后 看最大值是多少。

穷举长度 L 的时间是 n,每次计算的时间是 n/L。所以整个做法的时间复杂度是 O(n/1+n/2+n/3+......+n/n)=O(nlogn)。

我们不知道它的长度,所以只能枚举长度

对于长度L,他的连续重复子串有的话一定覆盖掉s[1+L*i]中的相邻两个,我们把这样的位置成为“关键点”

所以对于每相邻两个位置(关键点)s[1+L*i]和s[1+L*(i+1)],求出他们往左和往右能匹配多远l和r(我的r是包括了这个关键点),然后在这一段内连续重复的次数step=(l+r)/L+1

(因为...自己想想吧,比如对于左端点,移动之后还是相同,还是两个左端点隔了L的距离)

一个重要的问题是字典序最小

对于靠左关键点i,向左能延伸l的话,[i-l,i-l+(l+r)%L]这个区间内开始大小重复次数不变((l+r)%L就是说这一个长度是空余的可以随便左右放),所以这一段求rnk最小值作为开始,同样对rnk处理ST表

 
[2017-02-06 ]
复习后缀数组又自己写了一遍.....
新问题:
1.求LCP别忘x++,因为是height
2.大于小于别写错了
3.反转之后别忘了转回来
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N=1e5+,INF=1e9;
int n,m,c[N],t1[N],t2[N];
char s[N]; int mn[N][],Log[N],Pow[];
void iniST(){
Pow[]=;for(int i=;i<;i++) Pow[i]=Pow[i-]<<;
Log[]=-;for(int i=;i<N;i++) Log[i]=Log[i>>]+;
}
void getST(int mn[N][],int a[N]){
for(int i=;i<=n;i++) mn[i][]=a[i];
for(int j=;j<=Log[n];j++)
for(int i=;i+Pow[j]-<=n;i++)
mn[i][j]=min(mn[i][j-],mn[i+Pow[j-]][j-]);
}
int RMQ(int x,int y){
if(x>y) swap(x,y);
int _=Log[y-x+];
return min(mn[x][_],mn[y-Pow[_]+][_]);
}
struct SA{
int sa[N],rnk[N],height[N];
inline bool cmp(int *r,int a,int b,int j){
return a+j<=n&&b+j<=n&&r[a]==r[b]&&r[a+j]==r[b+j];
}
void getSA(char s[]){
m=;
int *r=t1,*k=t2;
for(int i=;i<=m;i++) c[i]=;
for(int i=;i<=n;i++) c[r[i]=s[i]]++;
for(int i=;i<=m;i++) c[i]+=c[i-];
for(int i=n;i>=;i--) sa[c[r[i]]--]=i; for(int j=;j<=n;j<<=){
int p=;
for(int i=n-j+;i<=n;i++) k[++p]=i;
for(int i=;i<=n;i++) if(sa[i]>j) k[++p]=sa[i]-j; for(int i=;i<=m;i++) c[i]=;
for(int i=;i<=n;i++) c[r[k[i]]]++;
for(int i=;i<=m;i++) c[i]+=c[i-];
for(int i=n;i>=;i--) sa[c[r[k[i]]]--]=k[i]; swap(r,k);p=;r[sa[]]=++p;
for(int i=;i<=n;i++) r[sa[i]]=cmp(k,sa[i],sa[i-],j)?p:++p;
if(p>=n) break;m=p;
}
}
void getHeight(char s[]){
for(int i=;i<=n;i++) rnk[sa[i]]=i;
int k=;
for(int i=;i<=n;i++){
if(k) k--;
if(rnk[i]==) continue;
int j=sa[rnk[i]-];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
height[rnk[i]]=k;
}
}
int mn[N][];
void ini(char s[]){getSA(s);getHeight(s);getST(mn,height);}
int lcp(int x,int y){
x=rnk[x];y=rnk[y];
if(x>y) swap(x,y);x++;//!!!
int _=Log[y-x+];
return min(mn[x][_],mn[y-Pow[_]+][_]);
}
}a,b; int cas=;
void solve(){
int lexi=INF,mx=,al=,ar=;
for(int L=;L<=n;L++){
for(int i=;i+L<=n;i+=L){
int l=b.lcp(n-i+,n-(i+L)+),r=a.lcp(i,i+L);
int step=(l+r)/L+;
if(step>mx){
mx=step;
int _=RMQ(i-l,i-l+(l+r)%L);
lexi=_;
al=a.sa[_],ar=al+L*step-;
}else if(step==mx){
int _=RMQ(i-l,i-l+(l+r)%L);
if(_<lexi) lexi=_,al=a.sa[_],ar=al+L*step-;
}
}
} printf("Case %d: ",++cas);
reverse(s+,s++n);
for(int i=al;i<=ar;i++) putchar(s[i]);
puts("");
}
int main(){
freopen("in","r",stdin);
iniST();
while(scanf("%s",s+)!=EOF){
if(s[]=='#') break;
n=strlen(s+);
a.ini(s);
//for(int i=1;i<=n;i++) printf("a %d %d %d\n",i,a.rnk[i],a.height[i]);
reverse(s+,s++n);
b.ini(s);
getST(mn,a.rnk);
solve();
}
}

2.26.2017

 
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N=1e5+,INF=1e9;
int n,m,c[N],t1[N],t2[N];
char s[N];
inline bool cmp(int *r,int a,int b,int j){
return a+j<=n&&b+j<=n&&r[a]==r[b]&&r[a+j]==r[b+j];
}
int Log[N],Pow[],mn[N][]; void iniST(){
Pow[]=;for(int i=;i<;i++)Pow[i]=Pow[i-]<<;
Log[]=-;for(int i=;i<=;i++)Log[i]=Log[i/]+;
}
void getST(int mn[N][],int a[]){
for(int i=;i<=n;i++) mn[i][]=a[i];
for(int j=;j<=Log[n];j++)
for(int i=;i+Pow[j]-<=n;i++)
mn[i][j]=min(mn[i][j-],mn[i+Pow[j-]][j-]);
} inline int rmq(int x,int y){
int t=Log[y-x+];
return min(mn[x][t],mn[y-Pow[t]+][t]);
} struct SA{
int sa[N],rnk[N],height[N],mn[N][]; void getHeight(){
int k=;
for(int i=;i<=n;i++) rnk[sa[i]]=i;
for(int i=;i<=n;i++){
if(k) k--;
if(rnk[i]==) continue;
int j=sa[rnk[i]-];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
height[rnk[i]]=k;
}
}
void getSA(){
int *r=t1,*k=t2;
for(int i=;i<=m;i++) c[i]=;
for(int i=;i<=n;i++) c[r[i]=s[i]]++;
for(int i=;i<=m;i++) c[i]+=c[i-];
for(int i=n;i>=;i--) sa[c[r[i]]--]=i; for(int j=;j<=n;j<<=){
int p=;
for(int i=n-j+;i<=n;i++) k[++p]=i;
for(int i=;i<=n;i++) if(sa[i]>j) k[++p]=sa[i]-j; for(int i=;i<=m;i++) c[i]=;
for(int i=;i<=n;i++) c[r[k[i]]]++;
for(int i=;i<=m;i++) c[i]+=c[i-];
for(int i=n;i>=;i--) sa[c[r[k[i]]]--]=k[i]; swap(r,k);p=;r[sa[]]=++p;
for(int i=;i<=n;i++) r[sa[i]]=cmp(k,sa[i],sa[i-],j)?p:++p;
if(p>=n) break;m=p;
}
} int lcp(int x,int y){
x=rnk[x];y=rnk[y];
if(x>y) swap(x,y);x++;
int t=Log[y-x+];
return min(mn[x][t],mn[y-Pow[t]+][t]);
} void ini(){
m=;
getSA();getHeight();getST(mn,height);
}
void test(){
for(int i=;i<=n;i++) printf("%c ",s[i]);puts("");
for(int i=;i<=n;i++) printf("%d ",rnk[i]);puts("");
for(int i=;i<=n;i++) printf("%d ",sa[i]);puts("");
for(int i=;i<=n;i++) printf("%d ",height[i]);puts("");
puts("");
}
}a,b;
int mx,ans,ansl,ansr;
void solve(int L){//printf("sol %d\n",L);
for(int i=;i+L<=n;i+=L)
if(s[i]==s[i+L]){
int r=a.lcp(i,i+L),l=b.lcp(n-i+,n-i-L+);
int step=(l+r)/L+;//printf("hi %d %d lr %d %d step %d\n",i,L,l,r,step);
if(step>mx) mx=step,ans=INF;//,printf("mx %d\n",mx);
if(step==mx){
int t=rmq(i-l,i-l+(l+r)%L);//printf("t %d\n",t);
if(t<ans){
ans=t;
ansl=a.sa[t],ansr=ansl+mx*L-;
}
}
}
} int main(){
int cas=;
iniST();
while(scanf("%s",s+)!=EOF){
if(s[]=='#') break;
n=strlen(s+);
a.ini();//a.test();
reverse(s+,s++n);
b.ini();//b.test(); getST(mn,a.rnk);
reverse(s+,s++n);
mx=;ans=INF;ansl=ansr=;
for(int i=;i<=n;i++)
if(a.rnk[i]<ans) ans=a.rnk[i],ansl=ansr=i;
for(int L=;L<=n;L++) solve(L); printf("Case %d: ",++cas);
for(int i=ansl;i<=ansr;i++) putchar(s[i]);
puts(""); }
}
 
 

POJ3693 Maximum repetition substring [后缀数组 ST表]的更多相关文章

  1. POJ3693 Maximum repetition substring —— 后缀数组 重复次数最多的连续重复子串

    题目链接:https://vjudge.net/problem/POJ-3693 Maximum repetition substring Time Limit: 1000MS   Memory Li ...

  2. POJ3693 Maximum repetition substring 后缀数组

    POJ - 3693 Maximum repetition substring 题意 输入一个串,求重复次数最多的连续重复字串,如果有次数相同的,则输出字典序最小的 Sample input ccab ...

  3. poj3693 Maximum repetition substring (后缀数组+rmq)

    Description The repetition number of a string is defined as the maximum number R such that the strin ...

  4. Maximum repetition substring 后缀数组

    Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7578   Acc ...

  5. POJ 3693 Maximum repetition substring ——后缀数组

    重复次数最多的字串,我们可以枚举循环节的长度. 然后正反两次LCP,然后发现如果长度%L有剩余的情况时,答案是在一个区间内的. 所以需要找到区间内最小的rk值. 两个后缀数组,四个ST表,$\Thet ...

  6. 【Poj-3693】Maximum repetition substring 后缀数组 连续重复子串

    POJ - 3693 题意 SPOJ - REPEATS的进阶版,在这题的基础上输出字典序最小的重复字串. 思路 跟上题一样,先求出最长的重复次数,在求的过程中顺便纪录最多次数可能的长度. 因为sa数 ...

  7. poj 3693 Maximum repetition substring (后缀数组)

    其实是论文题.. 题意:求一个字符串中,能由单位串repeat得到的子串中,单位串重复次数最多的子串.若有多个重复次数相同的,输出字典序最小的那个. 解题思路:其实跟论文差不多,我看了很久没看懂,后来 ...

  8. POJ 3693 Maximum repetition substring (后缀数组+RMQ)

    题意:给定一个字符串,求其中一个由循环子串构成且循环次数最多的一个子串,有多个就输出最小字典序的. 析:枚举循环串的长度ll,然后如果它出现了两次,那么它一定会覆盖s[0],s[ll],s[ll*2] ...

  9. POJ 3693 Maximum repetition substring(后缀数组+ST表)

    [题目链接] poj.org/problem?id=3693 [题目大意] 求一个串重复次数最多的连续重复子串并输出,要求字典序最小. [题解] 考虑错位匹配,设重复部分长度为l,记s[i]和s[i+ ...

随机推荐

  1. 使用redis构建可靠分布式锁

    关于分布式锁的概念,具体实现方式,直接参阅下面两个帖子,这里就不多介绍了. 分布式锁的多种实现方式 分布式锁总结 对于分布式锁的几种实现方式的优劣,这里再列举下 1. 数据库实现方式 优点:易理解 缺 ...

  2. 在线浏览PDF之PDF.JS (附demo)

    平台之大势何人能挡? 带着你的Net飞奔吧!:http://www.cnblogs.com/dunitian/p/4822808.html#skill 下载地址:http://mozilla.gith ...

  3. [C#] 走进 LINQ 的世界

    走进 LINQ 的世界 序 在此之前曾发表过三篇关于 LINQ 的随笔: 进阶:<LINQ 标准查询操作概述>(强烈推荐) 技巧:<Linq To Objects - 如何操作字符串 ...

  4. C++随笔:从Hello World 探秘CoreCLR的内部(1)

    紧接着上次的问题,上次的问题其实很简单,就是HelloWorld.exe运行失败,而本文的目的,就是成功调试HelloWorld这个控制台应用程序. 通过我的寻找,其实是一个名为TryRun的文件出了 ...

  5. 在vim中使用查找命令查找指定字符串

    要自当前光标位置向上搜索,请使用以下命令:         /pattern   Enter           其中,pattern   表示要搜索的特定字符序列.         要自当前光标位置 ...

  6. [转载]强制不使用“兼容性视图”的HTML代码

    在IE8浏览器以后版本,都有一个"兼容性视图",让不少新技术无法使用.那么如何禁止浏览器自动选择"兼容性视图",强制IE以最高级别的可用模式显示内容呢?下面就介 ...

  7. 【工具使用】mac电脑使用技巧

    本文地址 分享提纲: 1.  mac命令行和finder的交互 2. 一些mac的插件 3. 一些开发的配置 1.mac命令行和findder交互           1)命令行中打开当前文件夹: o ...

  8. PHP static静态属性和静态方法

    这里分析了php面向对象中static静态属性和静态方法的调用.关于它们的调用(能不能调用,怎么样调用),需要弄明白了他们在内存中存放位置,这样就非常容易理解了.静态属性.方法(包括静态与非静态)在内 ...

  9. 每天一个设计模式-7 生成器模式(Builder)

    每天一个设计模式-7 生成器模式(Builder) 一.实际问题 在讨论工厂方法模式的时候,提到了一个导出数据的应用框架,但是并没有涉及到导出数据的具体实现,这次通过生成器模式来简单实现导出成文本,X ...

  10. Mysql - 查询之关联查询

    查询这块是重中之重, 关系到系统反应时间. 项目做到后期, 都是要做性能测试和性能优化的, 优化的时候, 数据库这块是一个大头. sql格式: select 列名/* from 表名 where 条件 ...