【BZOJ2320】最多重复子串

Description

一个字符串P的重复数定义为最大的整数R,使得P可以分为R段连续且相同的子串。比方说,“ababab”的重复数为3,“ababa”的重复数为1。

Your Task

对于给定的串S,找出S的一个子串K使得K的重复数最大。

Input

第一行T表示数据组数

对于每组数据,一行中一个仅包含小写字母的字符串S

Output

对于每组数据,在一行中输出K,如果有多个解,输出字典序最小的那一个

Sample Input

2
ccabababc
daabbccaa

Sample Output

ababab
aa

HINT

100%:T≤10,S的长度不超过100000

题解:居然能第二次遇到这种套路,真是不容易(第一次在股市的预测)。

如果重复数为1,则答案就是最小的字符,下面只考虑重复数不是1的情况。

回忆next数组的性质,一个串的最小循环节为n-next[n](如果有的话),而我们要枚举什么呢?我们枚举的就是0~n-next[n]以及next[n]~n的部分。

具体地,我们枚举循环节的长度为len,然后每隔len的长度设一个关键点,这样就保证了每个循环节都只包含一个关键点。然后我们对于每个关键点i,求出它和下一个关键点的最长公共前缀A和最长公共后缀B,用$\lfloor{A+B-1\over len}\rfloor+1$更新答案。

如何求字典序最小呢?因为极长重复串的个数是O(n)的(Claris说的。。。),所以暴力判断即可。

时间复杂度取决于如何求LCP和LCS,如果用hash+二分的话是$O(nlog^2n)$的。

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;
typedef unsigned long long ull;
const int maxn=100010;
int n,ans,ap,bp;
ull hs[maxn],bs[maxn];
char str[maxn];
inline ull hash(int a,int b) {return hs[b]-((!a)?0:hs[a-1]*bs[b-a+1]);}
inline int lcs(int a,int b)
{
int l=0,r=min(a,b)+2,mid;
while(l<r)
{
mid=(l+r)>>1;
if(hash(a-mid+1,a)==hash(b-mid+1,b)) l=mid+1;
else r=mid;
}
return l-1;
}
inline int lcp(int a,int b)
{
int l=0,r=n-max(a,b)+1,mid;
while(l<r)
{
mid=(l+r)>>1;
if(hash(a,a+mid-1)==hash(b,b+mid-1)) l=mid+1;
else r=mid;
}
return l-1;
}
void updata(int a,int b)
{
if(ap==-1) ap=a,bp=b;
else
{
int l1=b-a+1,l0=bp-ap+1,k=min(lcp(a,ap),min(l1,l0));
if((k<=l1?str[a+k]:0)<(k<=l0?str[ap+k]:0)) ap=a,bp=b;
}
}
inline void calc(int x)
{
for(int i=0,a,b,c;i+x<n;i+=x) if(str[i]==str[i+x])
{
a=lcs(i,i+x),b=lcp(i,i+x),c=(a+b-1)/x+1;
if(c>ans) ans=c,ap=bp=-1;
if(ans!=1&&c==ans) for(int j=i-a+1;j+c*x-1<=i+x+b-1;j++) updata(j,j+c*x-1);
}
}
void work()
{
scanf("%s",str),n=strlen(str),ans=1,ap=bp=-1;
int i;
for(bs[0]=1,i=1;i<=n;i++) bs[i]=bs[i-1]*131;
for(i=0;i<n;i++) hs[i]=((!i)?0:hs[i-1])*131+str[i],ap=(ap==-1||str[i]<str[ap])?i:ap,bp=ap;
for(i=1;i<=n&&n/i>=ans;i++) calc(i);
for(i=ap;i<=bp;i++) printf("%c",str[i]);
printf("\n");
}
int main()
{
int T; scanf("%d",&T);
while(T--) work();
return 0;
}//1 ababacac

【BZOJ2320】最多重复子串 调和级数+hash的更多相关文章

  1. BZOJ2320 : 最多重复子串

    本题就是求重复数最多的字典序最小的$runs$,如果重复数为1,那么做法显然,然后只考虑重复数大于1的情况. 从小到大枚举长度$len$,对于每个关键点$x=i\times len$,有且仅有一个长度 ...

  2. 【TOJ 2406】Power Strings(KMP找最多重复子串)

    描述 Given two strings a and b we define a*b to be their concatenation. For example, if a = "abc& ...

  3. 【POJ 3693】Maximum repetition substring 重复次数最多的连续重复子串

    后缀数组的论文里的例题,论文里的题解并没有看懂,,, 求一个重复次数最多的连续重复子串,又因为要找最靠前的,所以扫的时候记录最大的重复次数为$ans$,扫完后再后从头暴力扫到尾找重复次数为$ans$的 ...

  4. spoj687 后缀数组重复次数最多的连续重复子串

    REPEATS - Repeats no tags  A string s is called an (k,l)-repeat if s is obtained by concatenating k& ...

  5. POJ-3693-Maximum repetition substring(后缀数组-重复次数最多的连续重复子串)

    题意: 给出一个串,求重复次数最多的连续重复子串 分析: 比较容易理解的部分就是枚举长度为L,然后看长度为L的字符串最多连续出现几次. 既然长度为L的串重复出现,那么str[0],str[l],str ...

  6. poj 3693 后缀数组 重复次数最多的连续重复子串

    Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 8669   Acc ...

  7. POJ-3693/HDU-2459 Maximum repetition substring 最多重复次数的子串(需要输出具体子串,按字典序)

    http://acm.hdu.edu.cn/showproblem.php?pid=2459 之前hihocoder那题可以算出最多重复次数,但是没有输出子串.一开始以为只要基于那个,每次更新答案的时 ...

  8. Repeats SPOJ - REPEATS(重复次数最多的连续重复子串)

    论文题例8 https://blog.csdn.net/queuelovestack/article/details/53031731这个解释很好 其实,当枚举的重复子串长度为i时,我们在枚举r[i* ...

  9. POJ 3693 Maximum repetition substring(最多重复次数的子串)

    Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 10461   Ac ...

随机推荐

  1. MySQL Win7 64位 下载、安装与配置图文教程

    MySQL是目前十分流行的一种关系型数据库管理系统.官网推出的安装包有两种格式,分别是:ZIP格式和MSI格式.其中MSI格式的可以直接点击安装,按照它给出的安装提示进行安装,一般MySQL将会安装在 ...

  2. 在Dell XPS 13安装WIN10和ubuntu双系统

    新入了Dell的XPS 13超级本,之所以买这个本子,就是看中它轻便且续航持久.这款本子也是为数不多的能够和苹果的13'' mac book air一较高下的本子.在重量上,占地面积和综合性价比上,还 ...

  3. 微信小程序 解决 数字粗细不一 的bug

    1.bug 2.原因解析 微信小程序本身字体问题 3.解决方案 设置字体 font-family: Microsoft YaHei; .

  4. iOS学习笔记23-音效与音乐

    一.音频 在iOS中,音频播放从形式上能够分为音效播放和音乐播放. * 音效: * 主要指一些短音频的播放,这类音频一般不须要进行进度.循环等控制. * 在iOS中.音效我们是使用AudioToolb ...

  5. shell脚本监控调度器/proc进程是否运行(嵌套循环)

    /proc/<pid>/schedstat $/schedstat First: , Second:time spent waiting on a runqueue,这个值与上面的se.w ...

  6. 《我是一只IT小小鸟》(胡江堂主编)读后感

    http://blog.csdn.net/wojiushiwo987/article/details/8685539<我是一只IT小小鸟>(胡江堂主编)读后感 2011年下半年研二的时候, ...

  7. ios 调试过程捕获异常Stack 信息

    在AppDelegate,定义方法 void catchExceptionHandler(NSException *exception) { NSLog(@"CRASH: %@", ...

  8. 把sqlserver查询结果复制到Excel出现数据记录遗漏

    问题:今天在sqlserver查询,总共有10000记录,把结果复制到Excel,发现少掉352条,用导出csv也是如此. 原因:经排查发现缺少的记录是因为商品名称字段包含英文双引号". 解 ...

  9. python操作xml文件

    一.什么是xml? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. abc.xml <?xml version="1.0&q ...

  10. Angular 2 组件之间如何通信?

    组件之间的共享可以有好几种方式 http://learnangular2.com/outputs/ 实例参考https://angular.io/docs/ts/latest/cookbook/com ...