[Note]后缀数组
后缀数组
代码
void rsort() {
for (int i = 1; i <= m; ++i) tax[i] = 0;
for (int i = 1; i <= n; ++i) ++tax[rnk[i]];
for (int i = 1; i <= m; ++i) tax[i] += tax[i-1];
for (int i = n; i >= 1; --i) sa[tax[rnk[tmp[i]]]--] = tmp[i];
}
void ssort() {
for (int i = 1; i <= n; ++i) rnk[i] = a[i], tmp[i] = i;
m = 127;
rsort();
for (int w = 1, p = 0; p < n; w <<= 1) {
p = 0;
for (int i = 1; i <= w; ++i) tmp[++p] = n - w + i;
for (int i = 1; i <= n; ++i) if (sa[i] > w) tmp[++p] = sa[i] - w;
rsort();
std::swap(rnk, tmp);
rnk[sa[1]] = p = 1;
for (int i = 2; i <= n; ++i) {
rnk[sa[i]] = (tmp[sa[i]] == tmp[sa[i-1]]
&& tmp[sa[i]+w] == tmp[sa[i-1]+w]) ? p : ++p;
}
m = p;
}
for (int i = 1, k = 0; i <= n; ++i) {
while (a[i+k] == a[sa[rnk[i]-1]+k]) ++k;
h[rnk[i]] = k;
if (k) --k;
}
}
应用
关于后缀数组和后缀自动机,在hihocoder上有一套很好的题(重复旋律)。
最长可重叠重复K次子串问题
(hiho1403)
h数组中长度为k的子串的最小值的最大值。
最长不可重叠重复子串问题
(hiho1407)
二分答案为k,若h数组中有连续的一段大于k的值(即有一个子串重复了),且这一段中最靠前的位置和最靠后的位置之间的差大于k(即这个子串可以不重叠),那么该答案合法。
bool check(int x) {
int mn = N + 10, mx = 0;
for (int i = 1, flag = 0; i <= n; ++i) {
if (h[i] >= x) {
if (!flag) { // mark
mx = std::max(mx, sa[i-1]);
mn = std::min(mn, sa[i-1]);
}
mx = std::max(mx, sa[i]);
mn = std::min(mn, sa[i]);
flag = 1;
} else if (flag) {
flag = 0;
if (mx - mn >= x) {
return true;
}
mn = N + 10;
mx = 0;
}
}
return false;
}
注意由于h数组的定义,我们需要标记为mark的部分。
最长公共子串问题
(hiho1415)
将两个子串拼接起来,用'#'分隔,那么两个串的最长公共子串就是保证sa[i]和sa[i-1]不在同一个串内的最大的h[i]。
连续重复次数最多的子串
(hiho1419)
枚举子串长度l和重复起点p,计算重复次数lcp(p, p+l)/l + 1,复杂度\(O(n^2)\)。
考虑优化,我们可以以l的间隔枚举p,考虑某个位置p,记lcp(p, p+l)为R,那么,被我们忽略掉的位置p-1,p-2,p-3...的答案值不会超过R+1。
对于\(p-R\bmod l < x < p\) 的\(x\),以x为起点的答案值不可能超过R(由公式易得),而对于\(p-l<x<p-R\bmod l\)的\(x\),以x为起点的答案值也不可能超过以p-R%l的答案值,所以只需计算成倍的p和p-R%l的答案值即可。
for (int l = 1; l <= n; ++l) {
for (int i = 1; i+l <= n; i += l) {
int R = lcp(i, i + l);
ans = std::max(ans, R / l + 1);
if (i >= l - R%l) {
ans = std::max(ans,
lcp(i - l + R%l, i + R%l) / l + 1);
}
}
}
不同子串的数目问题
\(\frac{1}{2}n(n+1)-\sum_{i=1}^n h[i]\)
[Note]后缀数组的更多相关文章
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- HDU5008 Boring String Problem(后缀数组 + 二分 + 线段树)
题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=5008 Description In this problem, you are given ...
- 后缀数组---Musical Theme
POJ 1743 Description A musical melody is represented as a sequence of N (1<=N<=20000)notes t ...
- POJ 1743 Musical Theme (后缀数组,求最长不重叠重复子串)(转)
永恒的大牛,kuangbin,膜拜一下,Orz 链接:http://www.cnblogs.com/kuangbin/archive/2013/04/23/3039313.html Musical T ...
- POJ 1743 Musical Theme 后缀数组 最长重复不相交子串
Musical ThemeTime Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://poj.org/problem?id=1743 Description ...
- hdu 5442 Favorite Donut 后缀数组
Favorite Donut Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://acm.hdu.edu.cn/showproblem.php?pid ...
- poj 1743 男人八题之后缀数组求最长不可重叠最长重复子串
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 14874 Accepted: 5118 De ...
- POJ1743---Musical Theme(+后缀数组二分法)
Description A musical melody is represented as a sequence of N (1<=N<=20000)notes that are int ...
- POJ1743 Musical Theme [后缀数组+分组/并查集]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
随机推荐
- PAT (Basic Level) Practice (中文)1038 统计同成绩学生 (20 分)
本题要求读入 N 名学生的成绩,将获得某一给定分数的学生人数输出. 输入格式: 输入在第 1 行给出不超过 1 的正整数 N,即学生总人数.随后一行给出 N 名学生的百分制整数成绩,中间以空格分隔.最 ...
- css总结 -使用display:inline-block,出现元素高度错位
在进行页面布局时发现一个问题,两个相同高度的元素显示高度不一致,发生错位. <style> .left{ display:inline-block; height:110p ...
- Spring学习笔记-装配Bean-02
什么是装配 创建应用对象之间写作关系的行为通常称为装配(wiring),这也是依赖注入(DI)的本质. Spring配置的可选方案 Spring提供了3中主要的装配机制: ● 在XML中进行显式配置. ...
- Codeforces Round #616 (Div. 2) B. Array Sharpening
t题目链接:http://codeforces.com/contest/1291/problem/B 思路: 用极端的情况去考虑问题,会变得很简单. 无论是单调递增,单调递减,或者中间高两边低的情况都 ...
- Luogu4316 | 绿豆蛙的归宿 (期望DP)
题目背景 随着新版百度空间的上线,Blog宠物绿豆蛙完成了它的使命,去寻找它新的归宿. 题目描述 给出一个有向无环图,起点为1终点为N,每条边都有一个长度,并且从起点出发能够到达所有的点,所有的点也都 ...
- VScode usage
Common settings editor.minimap.enabled //close the preview workbench.editor.show tabs // show f ...
- pom中<scope></scope>一些理解
compile:默认值,表示当前依赖包,要参与当前项目的编译,后续测试,运行时,打包provided:代表在编译和测试的时候用,运行,打包的时候不会打包进去test:表示当前依赖包只参与测试时的工作: ...
- vs2017+resharper之常用快捷键备忘
1.安装resharper后以vs2017的快捷键为主,让resharper作为一些方便的快捷键的补充. 2.vs2017的c++6的键盘布局模式快捷键 IntelliSence: 列表成员: Ctr ...
- python之路函数
1.函数参数,引用 2.lambda表达式 lambda表达式 f1 = lambda a1,a2: a1+a2 3.python的内置函数 abs(),绝对值 all(),循环参数,如果每个元素都为 ...
- 【转】Error,java对常量池来说字符串xxx的UTF8表示过长的解决及其理解
做项目,客户端这里自己模拟json数据时,一时没忍住搞得json字符串太长了(idea上大概有600多行吧),这个问题就蹦出来了.老方法直接google.百度然后看到一堆有关String 字符串常量池 ...