[笔记]后缀数组SA
参考资料
这次是真抄的:
1.后缀数组详解
2.后缀数组-学习笔记
3.后缀数组——处理字符串的有力工具
定义
\(SA\)排名为\(i\)的后缀的位置
\(rk\)位置为\(i\)的后缀的排名
\(tp\)第二关键字的排名为\(i\)的后缀的位置,还被用作\(rank\)的暂存
\(tax\)每个排名对应的后缀数量
后缀数组就是为了求出\(sa\)和\(rk\)
性质
\(rk[sa[i]]=i\) \(sa[rk[i]]=i\)
$LCP(x,y) $:字符串x与字符串y的最长公共前缀,在这里指x号后缀与与y号后缀的最长公共前缀
\(height[i]=lcp ( sa[i],sa[i - 1] )\),即排名为\(i\)的后缀与排名为\(i−1\)的后缀的最长公共前缀
\(H[i]:height[rak[i]]\),即\(i\)号后缀与它前一名的后缀的最长公共前缀
\(H[i] \geqslant H[i - 1] - 1\) 证明
$LCP(i,j)=LCP(j,i) $
\(LCP(i,i)=len(sa[i])=n-sa[i]+1\)
\(LCP(i,k)=min\left\{height[j] \right\}(i+1<=j<=k)\)
\(S\)不同的子串个数\(\dfrac{n(n+1)}{2} -\sum_{i=1}^nheight[i]\)
代码
#include <iostream>
#include <cstdio>
#include <string>
#define R register int
using namespace std;
const int N = 1000005;
string s;
/* sa[i]:排名为i的后缀的位置
rak[i]:从第i个位置开始的后缀的排名,下文为了叙述方便,把从第i个位置开始的后缀简称为后缀i
tp[i]:基数排序的第二关键字,意义与sa一样,即第二关键字排名为i的后缀的位置
tax[i]:i号元素出现了多少次。辅助基数排序
s:字符串,s[i]表示字符串中第i个字符串*/
int n, m, sa[N], rk[N], tp[N], c[N];
void _sort() {
for(R i = 1; i <= m; ++i) c[i] = 0;
for(R i = 1; i <= n; ++i) c[rk[i]]++;
for(R i = 1; i <= m; ++i) c[i] += c[i - 1];
for(R i = n; i >= 1; --i) sa[c[rk[tp[i]]]--] = tp[i];
}
void SA() {
m = 150;
for(R i = 1; i <= n; ++i) rk[i] = s[i - 1], tp[i] = i;
_sort();
for(R w = 1, p = 0; p < n && w <= n; m = p, w <<= 1) {
p = 0;
for(R i = 1; i <= w; ++i) tp[++p] = n - w + i;
for(R i = 1; i <= n; ++i) if(sa[i] > w) tp[++p] = sa[i] - w;
_sort();
swap(tp, rk);
rk[sa[1]] = p = 1;
for(R i = 2; i <= n; ++i)
rk[sa[i]] = (tp[sa[i - 1]] == tp[sa[i]] && tp[sa[i - 1] + w] == tp[sa[i] + w])
? p : ++p;
}
}
/*i号后缀:从i开始的后缀
lcp(x,y):字符串x与字符串y的最长公共前缀,在这里指x号后缀与与y号后缀的最长公共前缀
height[i]:lcp(sa[i],sa[i?1]),即排名为i的后缀与排名为i?1的后缀的最长公共前缀
H[i]:height[rak[i]],即i号后缀与它前一名的后缀的最长公共前缀*/
int Height[N];
void Get() {
int j, k = 0;
for(int i = 1; i <= n; i++) {
if(k) k--;
j = sa[rk[i] - 1];
while(s[i + k - 1] == s[j + k - 1]) ++k;
Height[rk[i]] = k;
}
}
int main()
{
cin >> s;
n = s.length();
SA();
for(R i = 1; i <= n; ++i) printf("%d ", sa[i]);
cout << endl;
Get();
return 0;
}
Problem
\(ans=\dfrac{n(n+1)}{2} -\sum height[i]\)
Luogu
P3809 【模板】后缀排序
P4070 [SDOI2016]生成魔咒
P3311 [SDOI2014]数数
P4051 [JSOI2007]字符加密
P2463 [SDOI2008]Sandy的卡片
P2408 不同子串个数
[笔记]后缀数组SA的更多相关文章
- 后缀数组SA学习笔记
什么是后缀数组 后缀数组\(sa[i]\)表示字符串中字典序排名为\(i\)的后缀位置 \(rk[i]\)表示字符串中第\(i\)个后缀的字典序排名 举个例子: ababa a b a b a rk: ...
- 后缀数组(SA)总结
后缀数组(SA)总结 这个东西鸽了好久了,今天补一下 概念 后缀数组\(SA\)是什么东西? 它是记录一个字符串每个后缀的字典序的数组 \(sa[i]\):表示排名为\(i\)的后缀是哪一个. \(r ...
- 后缀数组SA入门(史上最晦涩难懂的讲解)
参考资料:victorique的博客(有一点锅无伤大雅,记得看评论区),$wzz$ 课件(快去$ftp$%%%),$oi-wiki$以及某个人的帮助(万分感谢!) 首先还是要说一句:我不知道为什么我这 ...
- bzoj3796(后缀数组)(SA四连)
bzoj3796Mushroom追妹纸 题目描述 Mushroom最近看上了一个漂亮妹纸.他选择一种非常经典的手段来表达自己的心意——写情书.考虑到自己的表达能力,Mushroom决定不手写情书.他从 ...
- 【字符串】后缀数组SA
后缀数组 概念 实际上就是将一个字符串的所有后缀按照字典序排序 得到了两个数组 \(sa[i]\) 和 \(rk[i]\),其中 \(sa[i]\) 表示排名为 i 的后缀,\(rk[i]\) 表示后 ...
- 浅谈后缀数组SA
这篇博客不打算讲多么详细,网上关于后缀数组的blog比我讲的好多了,这一篇博客我是为自己加深印象写的. 给你们分享了那么多,容我自私一回吧~ 参考资料:这位dalao的blog 一.关于求Suffix ...
- 后缀数组SA
复杂度:O(nlogn) 注:从0到n-1 const int maxn=1e5; char s[maxn]; int sa[maxn],Rank[maxn],height[maxn],rmq[max ...
- 洛谷2408不同字串个数/SPOJ 694/705 (后缀数组SA)
真是一个三倍经验好题啊. 我们来观察这个题目,首先如果直接整体计算,怕是不太好计算. 首先,我们可以将每个子串都看成一个后缀的的前缀.那我们就可以考虑一个一个后缀来计算了. 为了方便起见,我们选择按照 ...
- 洛谷4248 AHOI2013差异 (后缀数组SA+单调栈)
补博客! 首先我们观察题目中给的那个求\(ans\)的方法,其实前两项没什么用处,直接\(for\)一遍就求得了 for (int i=1;i<=n;i++) ans=ans+i*(n-1); ...
随机推荐
- Java设计模式学习记录-解释器模式
前言 这次介绍另一个行为模式,解释器模式,都说解释器模式用的少,其实只是我们在日常的开发中用的少,但是一些开源框架中还是能见到它的影子,例如:spring的spEL表达式在解析时就用到了解释器模式,以 ...
- 2017 ACM/ICPC Asia Regional Qingdao Online解题报告(部分)
HDU 6206 Apple 题意: 给出四个点的坐标(每个点的坐标值小于等于1,000,000,000,000),问最后一个点是否在前三个点组成的三角形的外接圆内,是输出Accept,否输出Reje ...
- Vim——回顾整理
一.命令练习(一) hjkl(左下上右) 保存到某路径 :saveas 路径 w 到下一个单词的开头 e 到下一个单词的结尾 % 括号匹配移动(),{},[] 0 到行头 $ 到行头 gU字母变大写 ...
- [javaEE] Servlet的手动配置
一.Servlet sun提供的一种动态web资源开发技术,本质上就是一段java小程序,可以将Sevlet加入到Servlet容器中 *Servlet容器 -- 能够运行Servlet的环境就叫做S ...
- Java事件处理机制(深入理解)
本文是关于Java事件处理机制的梳理,以及有重点的介绍一些注意点,至于基础的概念啥的不多赘述. 一.Java事件处理机制初步介绍(看图理解) 根据下图,结合生活实际,可以得知监护人可以有多个,坏人对小 ...
- java中自己常犯的错误汇总
package debug; /** 1.定义一个公共的动物类,包含名字.年龄.颜色和吃饭东西方法 2.定义一个猫类,继承动物类,同时拥有玩游戏的本领 3.定义一个狗类,继承动物类,同时拥有看门的本领 ...
- kafka安装与简单使用
一.kafka安装 安装是非常简单的,现在推荐安装0.8的版本,这个版本是非常稳定的,而且公司里面也多用此版本. 简单的安装: 这个是我使用的版本,kafka_2.11-0.8.2.2.tgz 直接t ...
- 正则与python的re模块
一.正则表达式的语法 正则表达式使用反斜杠字符('\')来表示特殊的形式或者来允许使用特殊的字符而不要启用它们特殊的含义.这与字符串字面值中相同目的的相同字符的用法冲突:例如,要匹配一个反斜线字面值, ...
- 洛谷P2178 [NOI2015]品酒大会(后缀自动机 线段树)
题意 题目链接 Sol 说一个后缀自动机+线段树的无脑做法 首先建出SAM,然后对parent树进行dp,维护最大次大值,最小次小值 显然一个串能更新答案的区间是\([len_{fa_{x}} + 1 ...
- 3dmax导入模型,解决贴图不显示的问题
在3dmax中导入模型数据后,经常出现贴图不显示的情况,效果如下图: 解决方法: 1.怀疑是贴图文件的路径设置有误.快捷键 shift+T打开“资源追踪”界面,重新设置贴图的正确路径(这里如果快捷键无 ...