BZOJ 1031 [JSOI2007]字符加密Cipher 后缀数组教程
1031: [JSOI2007]字符加密Cipher
Description

Input
输入文件包含一行,欲加密的字符串。注意字符串的内容不一定是字母、数字,也可以是符号等。
Output
输出一行,为加密后的字符串。
Sample Input
Sample Output
HINT
对于100%的数据字符串的长度不超过100000。
感人啊。这是第一道后缀数组的题目。早在高一寒假期间,就有学长讲过后缀数组(但当时内心当然崩溃欲绝)。后来,在高一下期,我也曾致力学习后缀数组。当时是有成效的,至少当时理解了倍增法,会解height数组,还会解一些经典题目。但时过境迁,一切都不一样了。后来,在沈阳又有学长讲授,但是也没有太大的收获(准确的说,这位一本爷的后缀数组还没有我好)。
然后,然后,我就忘了。
看来事情就是这样了。如果不练习,那很快就会忘记。
我们来普及一下吧。其实后缀数组,sa就是求排名第i的是谁,rank就是求i排名第几,很明显sa与rank互为反函数。也就是说,sa[rank[i]]=i,排名第rank[i](i的排名)的是i。rank[sa[i]]=i,sa[i](排名第i的是谁)排名第i。这是很有趣的。
而sa其实对应了一种有趣的树:后缀树。什么是后缀树呢?其实就是把一个串S的所有后缀串都插入一个trie,这个trie很明显与该串所有子串插入后形成的trie等价(每一个子串都是一个后缀的前缀)。但是,这样的树有O(n^2)个节点,想要实际建出明显不可能。
不能实际建出,于是有人就像要把这棵树压缩且不改变效果,于是有了O(n)的后缀自动机。当然,"实用"化后的后缀树也压缩过。但是,后缀树在OI中的应用并不广泛。

但是,我们也可以观察,发现可以把后缀树的末梢对应后缀从左往右写出,形成了一个数组,学名suffix_array,简称sa。当然,完整的模拟还需要一个height数组,意为sa[i-1]与sa[i]的最长公共前缀(一个不等式就可解决:height[rank[i]]>=height[rank[i-1]]-1,画图易证)。
如何求sa和rank呢?我们通常有2种方法,一种人称倍增O(nlog n),另一种人称DC3 O(n)。DC3常数大得起飞,通常人们都写倍增。
倍增是什么?还是建议去看一看罗穗骞。

很有道理。1,2,4,8,16,32……最多log n次排序即可达到目标。但是一次排序怎么能是O(nlg n)的呢?于是通常会用基数排序,基数排序即是从优先级低的位到优先级高的位,对于每一位进行计数排序,中间保证是稳定的。这里排序的稳定性是指按优先级高的位排序过后,若优先级高的位相同则优先级低的位相对顺序不变。
计数排序即是人们俗称的桶排序(但是《算导》上说这是两种算法……迷……),把值扔到桶中,统计前缀和,然后得出排名。
假设给n个数基数排序,是BASE“进制”的,这些数值域为W,那么需要进行logBASEW次计数排序。总的时间复杂度为max(n,BASE)*logBASEW,而空间复杂度为max(n,BASE)。
发一波代码吧:
好的,我们已经会计数排序和基数排序了。我们发现,在每一次倍增时,第二关键字可以直接处理,而第一关键字需要在此之上进行一次计数排序。然后,把新的rank处理出来,因为对于每一次倍增,实时性的rank是排序所必须的value。
此处有一个小优化,一旦出现了多于lens个排名,那么排序已经结束,就可以退出了。
这是我此题的代码(也是后缀数组的模板这里小小提一下,注意一个地方的顺序,刘汝佳在此处是错的):
/**************************************************************
Problem: 1031
User: Doggu
Language: C++
Result: Accepted
Time:1032 ms
Memory:4140 kb
****************************************************************/ #include <cstdio>
#include <cstring>
#include <algorithm>
const int S = ;
int bucket[S], rank[S], half[S], sa[S];
char ss[S];
void counting_sort(int range,int lens) {//In suffix_array, rank is the value, half is the radix, counting_sort and count_sort are radix sort
for( int i = ; i < range; i++ ) bucket[i]=;//clear
for( int i = ; i < lens; i++ ) bucket[rank[half[i]]]++;
for( int i = ; i < range; i++ ) bucket[i]+=bucket[i-];
for( int i =lens-; i>=; i-- ) sa[--bucket[rank[half[i]]]]=half[i];//half-->sa who to the what rank
}
bool cmp(int i,int k,int lens) {return half[sa[i]]==half[sa[i-]]&&(sa[i]+k<lens?half[sa[i]+k]:'\0')==(sa[i-]+k<lens?half[sa[i-]+k]:'\0');}
void calculate(int range) {
int lens = strlen(ss);
for( int i = ; i < lens; i++ ) rank[i]=ss[i], half[i]=i;
counting_sort(range,lens);
for( int k = ; k <= lens; k<<= ) {
int p=;for( int i = lens-1; i >= lens-k; i-- ) half[p++]=i;
for( int i = ; i < lens; i++ ) if(sa[i]>=k) half[p++]=sa[i]-k;
counting_sort(range,lens);std::swap(rank,half);range=;rank[sa[]]=;
for( int i = ; i < lens; i++ ) rank[sa[i]]=cmp(i,k,lens)?range-:range++;
if(range>=lens) break;
}
}
int main() {
scanf("%s",ss);
int lens = strlen(ss);
for( int i = lens; i < *lens; i++ ) ss[i]=ss[i-lens];ss[*lens]='\0';
calculate();
for( int i = ; i < *lens; i++ ) if(sa[i]<lens) printf("%c",ss[sa[i]+lens-]);printf("\n");
return ;
}
BZOJ 1031 [JSOI2007]字符加密Cipher 后缀数组教程的更多相关文章
- BZOJ 1031 [JSOI2007]字符加密Cipher | 后缀数组模板题
BZOJ 1031 [JSOI2007]字符加密Cipher | 后缀数组模板题 将字符串复制一遍接在原串后面,然后后缀排序即可. #include <cmath> #include &l ...
- BZOJ 1031: [JSOI2007]字符加密Cipher 后缀数组
1031: [JSOI2007]字符加密Cipher Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 6014 Solved: 2503[Submit ...
- bzoj 1031 [JSOI2007]字符加密Cipher 后缀数组模板
题目链接 题目描述 喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考.一天,他突然想出了一种他认为是终极的加密办法 :把需要加密的信息排成一圈,显然,它们有很多种不同的读法.例如下图,可以读作: ...
- bzoj 1031: [JSOI2007]字符加密Cipher 後綴數組模板題
1031: [JSOI2007]字符加密Cipher Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 3157 Solved: 1233[Submit ...
- 【BZOJ1031】[JSOI2007]字符加密Cipher 后缀数组
[BZOJ1031][JSOI2007]字符加密Cipher Description 喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考.一天,他突然想出了一种他认为是终极的加密办法 :把需要加密的 ...
- 【BZOJ 1031】[JSOI2007]字符加密Cipher(后缀数组模板)
[题目链接]:http://www.lydsy.com/JudgeOnline/problem.php?id=1031 [题意] [题解] 后缀数组模板题; 把整个字符串扩大一倍. 即长度乘2 然后搞 ...
- 1031. [JSOI2007]字符加密【后缀数组】
Description 喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考.一天,他突然想出了一种他认为是终极的加密办法 :把需要加密的信息排成一圈,显然,它们有很多种不同的读法.例如下图,可以读作 ...
- bzoj 1031 [JSOI2007]字符加密Cipher
求出来后缀数组的rank就行了,不会可以去看集训队论文. #include<iostream> #include<cstdio> #include<cstring> ...
- bzoj 1031: [JSOI2007]字符加密Cipher【后缀数组】
算是SA的裸题了 把串复制一遍接在原串后面,然后求SA,然后按着SA的顺序输出尾字符即可 #include<iostream> #include<cstdio> #includ ...
随机推荐
- 20155334 《网络攻防》Exp4 恶意代码分析
<网络攻防>Exp4 恶意代码分析 一.实验问题回答 如果在工作中怀疑一台主机上有恶意代码,但只是猜想,所有想监控下系统一天天的到底在干些什么.请设计下你想监控的操作有哪些,用什么方法来监 ...
- kvm虚拟化二: 字符界面管理及 无人值守安装
1. 安装必要工具yum install / tigervnc //vnc远程桌面客户端 virt-viewer //虚拟机查看器 2.安装虚拟机virt-install / -n 名字 //虚拟机名 ...
- libgdx学习记录1——图片显示Texture
libgdx底层采用opengl渲染,对图片进行了优化处理,与android原生态的bitmap不太一样. 相比而言,效率要高一些,不过只支持png,jpg,bmp三种格式. 显示中,一般将图片放在a ...
- [LOJ#2878]. 「JOISC 2014 Day2」邮戳拉力赛[括号序列dp]
题意 题目链接 分析 如果走到了下行车站就一定会在前面的某个车站走回上行车站,可以看成是一对括号. 我们要求的就是 类似 代价最小的括号序列匹配问题,定义 f(i,j) 表示到 i 有 j 个左括号没 ...
- chrome浏览器插件 Octotree 让你浏览GitHub的时候像IDE 一样提供项目目录
GitHub 作为代码托管平台,竟然没有提供项目目录,方便用户在线快速浏览项目结构.所以,在线分析项目源码就会变得很繁琐,必须一层一层点击,然后再一次一次地向上返回.要知道,本来 GitHub 网站在 ...
- PHP 设计模式六大原则
http://www.cnblogs.com/yujon/p/5536118.html 设计模式六大原则(1):单一职责原则 不要存在多于一个导致类变更的原因.通俗的说,即一个类只负责一项职责 设计模 ...
- Java实验报告(实验五)
课程:Java程序设计 班级:1351 姓名:王玮怡 学号:20135116 成绩: 指导教师: ...
- 第三个Sprint ------第一天
Github账户: 账户名称:kangqu Github地址: https://github.com/kangqu/country.git Github网站全英文,表示鸭梨山大...
- 《Bandwidth-Aware Scheduling With SDN in Hadoop:A New Trend for Big Data》--2017
Hadoop中使用SDN的带宽感知调度:大数据的一种新趋势 Abstract: 为了处理大规模的数据,提出了基于Hadoop框架的MapReduce,在Hadoop系统中,有一种叫做NP完全最小(NP ...
- PAT 1044 火星数字
https://pintia.cn/problem-sets/994805260223102976/problems/994805279328157696 火星人是以13进制计数的: 地球人的0被火星 ...