poj 1743 Musical Theme(最长重复子串 后缀数组)

有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:1.长度至少为5个音符。2.在乐曲中重复出现(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)。3.重复出现的同一主题不能有公共部分。

首先把序列差分一下,那么现在,问题就转换成了:给定一个字符串,求最长重复子串,这两个子串不能重叠。

先来看看最长可重叠重复子串吧。首先,一对极长重复子串必定可以表示为两个后缀的LCP。同时,任意两个后缀的LCP也必定对应一对极长重复子串。它们是满射的关系。因此最长可重叠重复子串的长度相当于任意一对后缀的lcp中最长的,显然就是最大的height。

那这个做法如何推广到最长不可重叠后缀呢?我们可以发现,只有当两个后缀的距离大于它们的lcp时,才能被纳入计算。在这种情况下,我们不能保证height中的最大值一定是答案,有可能最优值的两个后缀之间隔了多个后缀。做法是二分子串长度L,将后缀数组分成若干组,每个组内的height都大于L。记录组内位置最小的,位置最大的串,看看它们之间的距离是否大于子串长度。如果是这样的,那么mid=l+1,否则mid=r。

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std; const int maxn=4e4+5;
int n, m, a[maxn]; int *x, *y, *t, wa[maxn], wb[maxn], ws[maxn], wv[maxn], sa[maxn], ht[maxn];
int cmp(int *r, int a, int b, int l){
return r[a]==r[b]&&r[a+l]==r[b+l]; }
void da(int *r){
x=wa; y=wb; m=maxn;
for (int i=0; i<m; ++i) ws[i]=0;
for (int i=0; i<n; ++i) ++ws[x[i]=r[i]];
for (int i=1; i<m; ++i) ws[i]+=ws[i-1];
for (int i=0; i<n; ++i) sa[--ws[r[i]]]=i; //sa数组必须排好序
int i, j, p=0;
for (j=1; j<n&&p<n; j<<=1, m=p+1){ //p代表当前倍增情况下有多少不同的后缀 m应当变成p+1
for (p=0, i=n-j; i<n; ++i) y[p++]=i;
for (i=0; i<n; ++i) if (sa[i]>=j) y[p++]=sa[i]-j;
for (i=0; i<n; ++i) wv[i]=x[y[i]]; //wv:第二关键词中排i的数,在第一关键词中排第几
for (i=0; i<m; ++i) ws[i]=0;
for (i=0; i<n; ++i) ++ws[x[i]]; //ws:第一关键词中排名为i的数,总排名的范围是多少
for (i=1; i<m; ++i) ws[i]+=ws[i-1];
for (i=n-1; i>=0; --i) sa[--ws[wv[i]]]=y[i];
t=x; x=y; y=t; x[sa[0]]=1;
for (p=1, i=1; i<n; ++i) //rank必须从1开始以区分空串
x[sa[i]]=cmp(y, sa[i-1], sa[i], j)?p:++p;
}
memset(ht, 0, sizeof(ht));
for (i=0; i<n; ++i) --x[i]; p=0;
for (i=0; i<n; ht[x[i++]]=p){ //枚举原串中1到n的所有后缀
if (!x[i]) continue;
for (p?p--:0, j=sa[x[i]-1]; r[i+p]==r[j+p]&&i+p<n; ++p); //p表示h[i]
}
return;
} int main(){
while (~scanf("%d", &n)&&n){
for (int i=0; i<n; ++i) scanf("%d", &a[i]);
for (int i=0; i<n; ++i) a[i]=a[i+1]-a[i]+88; --n;
da(a); int l=0, r=n, k, flag;
while (l<r){
k=(l+r)>>1; flag=0;
int minm=sa[0], maxm=sa[0];
for (int i=1; i<=n; ++i){
if (ht[i]<k){
if (maxm-minm>k) flag=1;
minm=sa[i]; maxm=sa[i]; continue;
}
minm=min(minm, sa[i]);
maxm=max(maxm, sa[i]);
}
if (flag) l=k+1; else r=k;
}
printf("%d\n", l<5?0:l);
}
return 0;
}

poj 1743 Musical Theme(最长重复子串 后缀数组)的更多相关文章

  1. POJ 1743 - Musical Theme 最长不重叠重复子串

    题意:    给出一列数据,问你其中重复的最长连续子串的长度    但是有要求:        1. 长度至少为 5 .        2. 两串可以不相等,但两串每个对应位置的数字相减差值固定 (即 ...

  2. POJ1743 Musical Theme 最长重复子串 利用后缀数组

    POJ1743 题目意思是求不重叠的最长相同变化的子串,输出该长度 比如1 2 3 4 5 6 7 8 9 10,最长长度为5,因为子串1 2 3 4 5 和 6 7 8 9 10变化都一样的 思路: ...

  3. 【poj1743-Musical Theme】不可重叠最长重复子串-后缀数组

    http://poj.org/problem?id=1743 这题是一道后缀数组的经典例题:求不可重叠最长重复子串. 题意: 有N(1 <= N <=20000)个音符的序列来表示一首乐曲 ...

  4. POJ 1743 Musical Theme (后缀数组,求最长不重叠重复子串)(转)

    永恒的大牛,kuangbin,膜拜一下,Orz 链接:http://www.cnblogs.com/kuangbin/archive/2013/04/23/3039313.html Musical T ...

  5. Poj 1743 Musical Theme (后缀数组+二分)

    题目链接: Poj  1743 Musical Theme 题目描述: 给出一串数字(数字区间在[1,88]),要在这串数字中找出一个主题,满足: 1:主题长度大于等于5. 2:主题在文本串中重复出现 ...

  6. poj 2774 最长公共子串 后缀数组

    Long Long Message Time Limit: 4000MS   Memory Limit: 131072K Total Submissions: 25752   Accepted: 10 ...

  7. POJ 1743 Musical Theme(不可重叠最长重复子串)

    题目链接:http://poj.org/problem?id=1743 题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一 ...

  8. POJ 1743 Musical Theme 【后缀数组 最长不重叠子串】

    题目冲鸭:http://poj.org/problem?id=1743 Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Su ...

  9. POJ - 1743 Musical Theme (后缀数组)

    题目链接:POJ - 1743   (不可重叠最长子串) 题意:有N(1<=N<=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的子串,它需要 ...

随机推荐

  1. java代码。。重温JPassword,JLabel,JPanel

    package com.kk; //JPasswordField类的使用 import java.awt.Color; import java.awt.FlowLayout; import javax ...

  2. MySQL 双主+keepalived 详细文档 M-M+keepalived

    1. 操作系统,系统环境,目结结构,用户,权限,日志路径,脚本2. 配置规范化 1.1 操作系统准备 操作系统 Kylin Linux release 3.3.1707 (Core)数据库版本 mys ...

  3. 淘宝的前端类库-KISSY

    KISSY(淘宝) KISSY是淘宝的前端类库,几乎在淘宝的每个页面上都能看到它的身影. KISSY提供稳定的核心,包括 oo.dom.Event.Anim.Ajax 等:强大且易用的脚本加载器,特有 ...

  4. HDLM工具介绍

    HDLM提供了以下一些工具,以方便HDLM多路径管理. 1. dlmgetras hdlm信息收集工具,用来收集hdlm相关的各种日志.trace.配置等文件,以方便进行hdlm故障分析. 命令格式 ...

  5. 云服务利用Auto Scaling节省30%成本

    公有云提供了很多免费的高级功能,很多中小用户以为自己用不上.实际上稍微研究一下,就能享受很多便利和节省不少成本. 本方案就是利用弹性伸缩(auto-scaling)减少服务器成本,几乎适合所有集群式部 ...

  6. Android 自定义带回调的Dialog 及EditText相关

      import android.app.Activity; import android.content.Context; import android.text.Editable; import ...

  7. ARQ

    自动重传请求(Automatic Repeat-reQuest,ARQ)是OSI模型中数据链路层和传输层的错误纠正协议之一.它通过使用确认和超时这两个机制,在不可靠服务的基础上实现可靠的信息传输.如果 ...

  8. startactivityforresult使用

    与startactivity基本相同,不过需要传入(intent,int)第二个int为请求ID,用来识别 在该activity中还应该重写nActivityResult(int requestCod ...

  9. R: 常用操作:

    ################################################### #清除所有变量: rm(list=ls()) #查看变量类型 getwd() setwd() i ...

  10. SDUT 3402 数据结构实验之排序五:归并求逆序数

    数据结构实验之排序五:归并求逆序数 Time Limit: 40MS Memory Limit: 65536KB Submit Statistic Problem Description 对于数列a1 ...