[Note]后缀数组
后缀数组
代码
void rsort() {
	for (int i = 1; i <= m; ++i) tax[i] = 0;
	for (int i = 1; i <= n; ++i) ++tax[rnk[i]];
	for (int i = 1; i <= m; ++i) tax[i] += tax[i-1];
	for (int i = n; i >= 1; --i) sa[tax[rnk[tmp[i]]]--] = tmp[i];
}
void ssort() {
	for (int i = 1; i <= n; ++i) rnk[i] = a[i], tmp[i] = i;
	m = 127;
	rsort();
	for (int w = 1, p = 0; p < n; w <<= 1) {
		p = 0;
		for (int i = 1; i <= w; ++i) tmp[++p] = n - w + i;
		for (int i = 1; i <= n; ++i) if (sa[i] > w) tmp[++p] = sa[i] - w;
		rsort();
		std::swap(rnk, tmp);
		rnk[sa[1]] = p = 1;
		for (int i = 2; i <= n; ++i) {
			rnk[sa[i]] = (tmp[sa[i]] == tmp[sa[i-1]]
			&& tmp[sa[i]+w] == tmp[sa[i-1]+w]) ? p : ++p;
		}
		m = p;
	}
	for (int i = 1, k = 0; i <= n; ++i) {
		while (a[i+k] == a[sa[rnk[i]-1]+k]) ++k;
		h[rnk[i]] = k;
		if (k) --k;
	}
}
应用
关于后缀数组和后缀自动机,在hihocoder上有一套很好的题(重复旋律)。
最长可重叠重复K次子串问题
(hiho1403)
h数组中长度为k的子串的最小值的最大值。
最长不可重叠重复子串问题
(hiho1407)
二分答案为k,若h数组中有连续的一段大于k的值(即有一个子串重复了),且这一段中最靠前的位置和最靠后的位置之间的差大于k(即这个子串可以不重叠),那么该答案合法。
bool check(int x) {
	int mn = N + 10, mx = 0;
	for (int i = 1, flag = 0; i <= n; ++i) {
		if (h[i] >= x) {
			if (!flag) { // mark
				mx = std::max(mx, sa[i-1]);
				mn = std::min(mn, sa[i-1]);
			}
			mx = std::max(mx, sa[i]);
			mn = std::min(mn, sa[i]);
			flag = 1;
		} else if (flag) {
			flag = 0;
			if (mx - mn >= x) {
				return true;
			}
			mn = N + 10;
			mx = 0;
		}
	}
	return false;
}
注意由于h数组的定义,我们需要标记为mark的部分。
最长公共子串问题
(hiho1415)
将两个子串拼接起来,用'#'分隔,那么两个串的最长公共子串就是保证sa[i]和sa[i-1]不在同一个串内的最大的h[i]。
连续重复次数最多的子串
(hiho1419)
枚举子串长度l和重复起点p,计算重复次数lcp(p, p+l)/l + 1,复杂度\(O(n^2)\)。
考虑优化,我们可以以l的间隔枚举p,考虑某个位置p,记lcp(p, p+l)为R,那么,被我们忽略掉的位置p-1,p-2,p-3...的答案值不会超过R+1。
对于\(p-R\bmod l < x < p\) 的\(x\),以x为起点的答案值不可能超过R(由公式易得),而对于\(p-l<x<p-R\bmod l\)的\(x\),以x为起点的答案值也不可能超过以p-R%l的答案值,所以只需计算成倍的p和p-R%l的答案值即可。
for (int l = 1; l <= n; ++l) {
	for (int i = 1; i+l <= n; i += l) {
		int R = lcp(i, i + l);
		ans = std::max(ans, R / l + 1);
		if (i >= l - R%l) {
			ans = std::max(ans,
			lcp(i - l + R%l, i + R%l) / l + 1);
		}
	}
}
不同子串的数目问题
\(\frac{1}{2}n(n+1)-\sum_{i=1}^n h[i]\)
[Note]后缀数组的更多相关文章
- POJ1743 Musical Theme [后缀数组]
		Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ... 
- HDU5008 Boring String Problem(后缀数组 + 二分 + 线段树)
		题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=5008 Description In this problem, you are given ... 
- 后缀数组---Musical Theme
		POJ 1743 Description A musical melody is represented as a sequence of N (1<=N<=20000)notes t ... 
- POJ 1743 Musical Theme (后缀数组,求最长不重叠重复子串)(转)
		永恒的大牛,kuangbin,膜拜一下,Orz 链接:http://www.cnblogs.com/kuangbin/archive/2013/04/23/3039313.html Musical T ... 
- POJ 1743 Musical Theme 后缀数组 最长重复不相交子串
		Musical ThemeTime Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://poj.org/problem?id=1743 Description ... 
- hdu 5442 Favorite Donut 后缀数组
		Favorite Donut Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://acm.hdu.edu.cn/showproblem.php?pid ... 
- poj 1743 男人八题之后缀数组求最长不可重叠最长重复子串
		Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 14874 Accepted: 5118 De ... 
- POJ1743---Musical Theme(+后缀数组二分法)
		Description A musical melody is represented as a sequence of N (1<=N<=20000)notes that are int ... 
- POJ1743 Musical Theme [后缀数组+分组/并查集]
		Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ... 
随机推荐
- 安装Logstash到linux(源码)
			运行环境 系统版本:CentOS Linux release 7.3.1611 (Core) 软件版本:logstash-7.1.0 硬件要求:最低2核4GB 安装过程 1.源码安装JDK 1.1.从 ... 
- 订阅消息---由于微信小程序取消模板消息,限只能开发订阅消息
			订阅消息开发步骤: 1.小程序管理后台添加订阅消息的模板 2.小程序前端编写调用(拉起)订阅授权 wx.requestSubscribeMessage({ tmplIds: ['34fwe1211xx ... 
- 【终端使用】常用Linux命令的基本使用
			常用Linux命令的基本使用: 命令 对应英文 作用 ls list 查看当前文件夹下的内容 pwd print work directory 查看当前所在的文件夹 cd [目录名] change d ... 
- 广搜 BFS()
			极其简陋的BFS模板 void BFS(???){ queue<node>q; node start, next; start = ???; q.push(start); while(!q ... 
- DFS-C - N皇后问题
			C - N皇后问题 在N*N的方格棋盘放置了N个皇后,使得它们不相互攻击(即任意2个皇后不允许处在同一排,同一列,也不允许处在与棋盘边框成45角的斜线上.你的任务是,对于给定的N,求出有多少种合法的放 ... 
- Dubbo之服务注册
			在上一篇文章Dubbo之服务暴露分析中介绍了当远程暴露时,如果有注册中心,需要在服务暴露后再将服务注册到注册中心.该篇将介绍该功能的有关步骤. 注册的起点 在RegistryProtocol.expo ... 
- 爬虫爱用的一些python技巧
			1.正则表达式 有时候提取到的数据不规整,需要用正则来匹配所需要展现出来的数据 学习链接:https://www.cnblogs.com/-chenxs/p/11352172.html,https:/ ... 
- javascript download geoserver layer as kml file
			var sqlfilter = " CITY='" + city + "' and SDATE>" + sdate + " and SDATE ... 
- vmware运行ubuntu虚拟机出现诡异的鼠标闪烁
			正在开心的写着AC自动机,突然发现鼠标消失了. 习惯性地动动鼠标,却还是没有反应,停止移动鼠标后鼠标却显现了出来??(吃惊.gif 在加载软件的时候,就算鼠标停止也会闪烁(其实这个虚拟机以前加载也会闪 ... 
- Linux 环境c++ 编码转换
			#include <iconv.h> //代码转换:从一种编码转为另一种编码 static int CodeConvert(char *from_charset,char *to_char ... 
