题目链接

题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数;

input:

aaaa
ababcabb
aaaaaa
#
output
2
3
3
 
思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的。
写写对后缀数组倍增算法的理解:
1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符'#',里面y[]是利用sa数组对第二个关键字重新排序,由于使用的是基数排序,所以当前一次长度为k时相同的子串,在下一次长为2*k时,y排在前面的下标得到的sa是要小的;
 
2.在getHeight函数中,rk[i]:后缀i在sa中的排名;height[i]表示s[i] 与s[i-1]的公共前缀长度。且s[i] 与 s[j] 的值为 RMQ(min{ height[i+1]...height[j] }),加上i < j;同时可以借助辅助数组h[i] = height[rk[i]],得到h[i] >= h[i-1] + 1;这样使用递推就可以将求解height[]的时间复杂度降为O(n);
 
注意:在输入串s末尾加入字符之后 n = strlen(s) + 1;在求解rk[]时,sa[i]是从1开始的,sa[0] = '$';之后的求解height[]还是从0开始;细节
 
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = ;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m,int n) // m为字符ASCII码的最大值+1;n = strlen(s) + 1;
{
int i,*x = t, *y = t2;
for(i = ;i < m; i++) c[i] = ;
for(i = ;i < n; i++) c[x[i] = s[i]]++;
for(i = ;i < m; i++) c[i] += c[i-];
for(i = n - ;i >= ; i--) sa[--c[x[i]]] = i;
for(int k = ;k <= n;k <<= ){
int p = ;
for(i = n - k;i < n;i++) y[p++] = i;
for(i = ;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k; for(i = ;i < m;i++) c[i] = ;
for(i = ;i < n;i++) c[x[y[i]]]++;
for(i = ;i < m;i++) c[i] += c[i-];
for(i = n - ;i >= ;i--) sa[--c[x[y[i]]]] = y[i]; swap(x,y);
x[sa[]] = ;// 将字符彻底转变为序号;
for(i = ,p = ;i < n;i++)
x[sa[i]] = y[sa[i]] == y[sa[i-]] && y[sa[i]+k] == y[sa[i-]+k]?p-:p++;
if(p >= n) break;
m = p;
}
}
int rk[MAXN],height[MAXN];
void getHeight()
{
int i,j,k = ;
for(i = ;i <= n;i++) rk[sa[i]] = i; // rk[i]:后缀i在sa[]中的下标,从1开始
for(i = ;i < n;i++){
if(k) k--;
if(rk[i] == ) continue;
j = sa[rk[i] - ];
while(i+k<n && j+k<n && s[i+k] == s[j+k]) k++;
height[rk[i]] = k; // h[i] = height[rk[i]]; h[i] >= h[i-1] - 1;
}
}
int main()
{
while(scanf("%s",s) == && s[] != '#'){
ll ans = ;
n = strlen(s);
s[n] = '#';
build_sa('z'+,n+);
getHeight();
for(int i = ;i <= n/; i++){
int l = n+,r = -;
for(int j = ;j <= n;j++){
if(height[j] >= i){// 递推出最左最优的l,r;
r = max(r,max(sa[j],sa[j-]));
l = min(l,min(sa[j],sa[j-]));
}
else{
if(r-l >= i) ans++;
r = -,l = n+;
}
}
if(r-l >= i) ans++;
}
printf("%I64d\n",ans);
}
return ;
}
 

hdu 3518 Boring counting 后缀数组LCP的更多相关文章

  1. hdu 3518 Boring counting 后缀数组基础题

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission( ...

  2. hdu 3518 Boring counting 后缀数组

    题目链接 根据height数组的性质分组计算. #include <iostream> #include <vector> #include <cstdio> #i ...

  3. hdu 3518 Boring counting 后缀数组 height分组

    题目链接 题意 对于给定的字符串,求有多少个 不重叠的子串 出现次数 \(\geq 2\). 思路 枚举子串长度 \(len\),以此作为分界值来对 \(height\) 值进行划分. 显然,对于每一 ...

  4. 后缀数组 --- HDU 3518 Boring counting

    Boring counting Problem's Link:   http://acm.hdu.edu.cn/showproblem.php?pid=3518 Mean: 给你一个字符串,求:至少出 ...

  5. HDU 3518 Boring counting(后缀数组,字符处理)

    题目 参考自:http://blog.sina.com.cn/s/blog_64675f540100k9el.html 题目描述: 找出一个字符串中至少重复出现两次的字串的个数(重复出现时不能重叠). ...

  6. HDU 3518 Boring counting

    题目:Boring counting 链接:http://acm.hdu.edu.cn/showproblem.php?pid=3518 题意:给一个字符串,问有多少子串出现过两次以上,重叠不能算两次 ...

  7. hdu3518 Boring counting(后缀数组)

    Boring counting 题目传送门 解题思路 后缀数组.枚举每种长度,对于每个字符串,记录其最大起始位置和最小起始位置,比较是否重合. 代码如下 #include <bits/stdc+ ...

  8. HDOJ 题目3518 Boring counting(后缀数组,求不重叠反复次数最少为2的子串种类数)

    Boring counting Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) ...

  9. poj 2774 Long Long Message 后缀数组LCP理解

    题目链接 题意:给两个长度不超过1e5的字符串,问两个字符串的连续公共子串最大长度为多少? 思路:两个字符串连接之后直接后缀数组+LCP,在height中找出max同时满足一左一右即可: #inclu ...

随机推荐

  1. javaEE的十三个技术规范

    java 是一种非常棒的语言,健壮,跨平台运行,屏蔽了具体的平台环境的要求,也就是说只要支持java 虚拟机,就可以运行java程序. 下面,我们一起学习一下J2EE的十三种技术规范. 一.JDBC: ...

  2. logstash jdbc 各种数据库配置

    MySQL数据库 Driver ="path/to/jdbc-drivers/mysql-connector-java-5.1.35-bin.jar"   //驱动程序Class ...

  3. HUST 1017 Exact cover (Dancing links)

    1017 - Exact cover 时间限制:15秒 内存限制:128兆 自定评测 6110 次提交 3226 次通过 题目描述 There is an N*M matrix with only 0 ...

  4. Commons CLI - Option Properties

    Option Properties The following are the properties that each Option has. All of these can be set usi ...

  5. Redis - 发布/订阅模式

    Redis 提供了一组命令可以让开发者实现 “发布/订阅” 模式.“发布/订阅” 可以实现进程间的消息传递,其原理是这样的: “发布/订阅” 模式中包含两种角色,分别是发布者和订阅者.订阅者可以订阅一 ...

  6. 免费主机kilu使用

    我也是看了这篇文章:http://www.cnblogs.com/tenny/archive/2011/03/30/1999957.html 采取申请注册. 主机申请地址:http://www.kil ...

  7. SVN Application

    一.SVN客户端:TortoiseSvn 下载地址: http://tortoisesvn.net/downloads.html 安装完后重启, 右击就可以使用SVN命令 首先, 从服务器版本库那边 ...

  8. sql语句聚合等疑难问题收集

    ------------------------------------------------------------------------------------ 除法运算 select 500 ...

  9. 日程管理控件 glDatePicker

    之前接触过一款日程管理控件,叫 FullCalendar,功能很强大,会列出每天的事项,可选择编辑并且可以定制自己的日历,然而,有时候,我们的网页上只需要一个简单的日历,迷你但实用,有日程安排的日期高 ...

  10. windbg基本命令

    1, .reload k 当前调用堆栈.u 当前正在执行的代码. 2, ~ 查看被调试进程中的线程信息每一行是一个线程的信息.第一行中,0 表示这个进程的编号:1ff4.1038 是 16 进制数字, ...