洛谷.3809.[模板]后缀排序(后缀数组 倍增) & 学习笔记
//输出ht见UOJ.35
#include<cstdio>
#include<cstring>
#include<algorithm>
const int N=1e6+5;
int n,tm[N],t1[N],t2[N],SA[N],rk[N],ht[N];
//SA[i]=j:排名为i的后缀开头的下标为j
//rk[i]=j:以下标i开头的后缀排名为j
//ht[i]:排名为i的后缀与排名为i-1的后缀的LCP长度
char s[N];
void Get_SA()
{
int *x=t1,*y=t2,limit=80;//首先对单个字符进行排序,limit最初就为字符集大小(就是不同字符的个数)
for(int i=0;i<n;++i) ++tm[x[i]=s[i]-'0'];
for(int i=1;i<limit;++i) tm[i]+=tm[i-1];
for(int i=n-1;~i;--i) SA[--tm[x[i]]]=i;//基数排序
//x[]相当于是rank值
for(int p=0,k=1;k<n;k<<=1,limit=p,p=0)//每次更新limit为p
{//p实际就是新一轮基数排序后 不同后缀的个数
//首先对第二关键字进行排序,y保存的就是对第二关键字排序后的结果
//这一过程可以直接用上次得到的SA[]求出
for(int i=n-k;i<n;++i) y[p++]=i;//第二关键字长度不为k,故先排
for(int i=0;i<n;++i) if(SA[i]>=k) y[p++]=SA[i]-k;//剩下的有完整第二关键字的(SA[i]>=k)按顺序,即SA[i]排,第一关键字的位置自然就是SA[i]-k
//对第一关键字的排序同对单个字符排序
for(int i=0;i<limit;++i) tm[i]=0;
for(int i=0;i<n;++i) ++tm[x[i]];//++tm[x[y[i]]];
for(int i=1;i<limit;++i) tm[i]+=tm[i-1];
for(int i=n-1;~i;--i) SA[--tm[x[y[i]]]]=y[i];//这个双关键字基数排序我现在也还是感觉好迷好nb=-= 并不很懂
//交换两个指针,因为要用到上一轮的rk(x),而y是没有用了
std::swap(x,y), x[SA[0]]=0, p=1;
//得到新的rank
for(int i=1;i<n;++i)
// x[SA[i]]=(y[SA[i-1]]==y[SA[i]]&&y[SA[i-1]+k]==y[SA[i]+k])?p-1:p++;//对于连续字符的字符串会WA //但是字符串下标从1开始(s[i]-'a'+1)就没事了...但注意要清空
if(y[SA[i-1]]==y[SA[i]]&&((y[SA[i-1]+k]==y[SA[i]+k]&&SA[i-1]+k<n&&SA[i]+k<n)||(SA[i-1]+k>=n&&SA[i]+k>=n))) x[SA[i]]=p-1;
else x[SA[i]]=p++;
if(p>=n) break;//不同字符串数已有n个,再继续倍增不会变了,break
}
}
void Calc_Ht()
{
for(int i=0;i<n;++i) rk[SA[i]]=i;//rk[]与SA[]互为反函数
// 有一个性质是:ht[rk[i]]>=ht[rk[i-1]]-1
// 因为去掉开头字符 后缀一大部分是相等的。比较明显
for(int j,k=0,i=0;i<n;ht[rk[i++]]=k)
{
if(!rk[i])// continue;//排名为0的字符串ht为0
{ht[0]=0;continue;}
j=SA[rk[i]-1], k?--k:0;//从k-1开始匹配(与上一名次字符串)
while(s[i+k]==s[j+k]&&i+k<n&&j+k<n) ++k;
}
}
int main()
{
// freopen("sais.in","r",stdin);
// freopen("sais.out","w",stdout);
scanf("%s",s),n=strlen(s);
Get_SA();
Calc_Ht();
for(int i=0;i<n;++i) printf("%d ",SA[i]+1);
putchar('\n');
for(int i=1;i<n;++i) printf("%d ",ht[i]);
return 0;
}
洛谷.3809.[模板]后缀排序(后缀数组 倍增) & 学习笔记的更多相关文章
- 洛谷4455 [CQOI2018]社交网络 (有向图矩阵树定理)(学习笔记)
sro_ptx_orz qwq算是一个套路的记录 对于一个有向图来说 如果你要求一个外向生成树的话,那么如果存在一个\(u\rightarrow v\)的边 那么\(a[u][v]--,a[v][v] ...
- 洛谷P3373 [模板]线段树 2(区间增减.乘 区间求和)
To 洛谷.3373 [模板]线段树2 题目描述 如题,已知一个数列,你需要进行下面两种操作: 1.将某区间每一个数加上x 2.将某区间每一个数乘上x 3.求出某区间每一个数的和 输入输出格式 输入格 ...
- 洛谷P1155 双栈排序题解(图论模型转换+二分图染色+栈)
洛谷P1155 双栈排序题解(图论模型转换+二分图染色+栈) 标签:题解 阅读体验:https://zybuluo.com/Junlier/note/1311990 原题地址:洛谷P1155 双栈排序 ...
- 洛谷 3379 最近公共祖先(LCA 倍增)
洛谷 3379 最近公共祖先(LCA 倍增) 题意分析 裸的板子题,但是注意这题n上限50w,我用的边表,所以要开到100w才能过,一开始re了两发,发现这个问题了. 代码总览 #include &l ...
- 洛谷P3763 [Tjoi2017]DNA 【后缀数组】
题目链接 洛谷P3763 题解 后缀数组裸题 在BZOJ被卡常到哭QAQ #include<algorithm> #include<iostream> #include< ...
- UOJ #35. 后缀排序[后缀数组详细整理]
#35. 后缀排序 统计 描述 提交 自定义测试 这是一道模板题. 读入一个长度为 nn 的由小写英文字母组成的字符串,请把这个字符串的所有非空后缀按字典序从小到大排序,然后按顺序输出后缀的第一个字符 ...
- Uoj #35. 后缀排序(后缀数组)
35. 后缀排序 统计 描述 提交 自定义测试 这是一道模板题. 读入一个长度为 nn 的由小写英文字母组成的字符串,请把这个字符串的所有非空后缀按字典序从小到大排序,然后按顺序输出后缀的第一个字符在 ...
- Codevs 1500 后缀排序(后缀数组)
1500 后缀排序 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 大师 Master 题目描述 Description 天凯是MIT的新生.Prof. HandsomeG给了他一个 ...
- 洛谷P3375 [模板]KMP字符串匹配
To 洛谷.3375 KMP字符串匹配 题目描述 如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置. 为了减少骗分的情况,接下来还要输出子串的前缀数组next.如果 ...
随机推荐
- LogParse-Windows系统日志分析
Windows系统日志分析 一.前言 本文将对常见的日志类型,利用微软日志分析工具(LogParser)结合已经掌握的恶意代码分析Windows系统日志,关联出系统的异常. 数据来源于Windows的 ...
- 【转】SSH服务详解
[转]SSH服务详解 第1章 SSH服务 1.1 SSH服务协议说明 SSH 是 Secure Shell Protocol 的简写,由 IETF 网络工作小组(Network Working Gro ...
- unbuntu 16.04.2 安装 Eclipse C++开发环境
1.安装JAVA (1)首先添加源: sudo gedit /etc/apt/sources.list 在打开的文件中添加如下内容并保存: deb http://ppa.launchpad.net/w ...
- makefile 中autoload
在openwrt的makefile中经常能看见这样的描述: define KernelPackage/mt7602e CATEGORY:=MTK Properties TITLE:=MTK MT7 ...
- centos7和centos6.5环境rpm方式安装mysql5.7和mysql5.6详解
centos环境安装mysql5.7 其实不建议安装mysql5.7 语法和配置可能和以前的版本区别较大,多坑,慎入 1.yum方式安装(不推荐) a.安装mysql5.7 yum源 centos6: ...
- 关于windows2008r2系统80端口被system进程占用的问题
80端口被system占用的问题 今天启动tomcat的时候发现无法启动80端口被占用 通过netstat -ano查看,发现被pid=4的进程占用 检查进程发现是system进程pid=4给占用 ...
- centos系统中perl进程病毒占用大量网络流量导致网络瘫痪的问题分析及解决方案
故障现象: 1.系统在早上9点的时候非常慢,单台服务器占用流量很大,使交换机流量被占满,而连累挂在同一交换机上的其他应用也无法提供服务,或者速度非常慢 2.通过查看进程发现大量的perl程序占 ...
- 转载:编译安装Nginx(1.5.1)《深入理解Nginx》(陶辉)
原文:https://book.2cto.com/201304/19618.html 1.5 configure详解 可以看出,configure命令至关重要,下文将详细介绍如何使用configure ...
- PYTHON-面向对象-练习-王者荣耀 对砍游戏
# 王者荣耀 对砍游戏# 两个英雄可以对砍 如果血量小于等于0 就GG# 所需的对象# 英雄对象""" 亚瑟 属性 类型 血量 名称 技能 Q 跳起来给你一刀 伤害50 ...
- js中数组去重
编写函数norepeat(arr) 将数组的重复元素去掉,并返回新的数组 [注]正序去重,会漏掉一些元素. [注]去重倒序. var arr = [10, 20, 30, 40, 30, 20, 20 ...