【TJOI2015】弦论 (后缀数组)
前言:
多好的题啊!
我理论$O(nlog_2n)$的后缀数组还带个常数26,竟然跑的比$O(n)$的后缀自动机还快,全场 Rak 1?
Description
为了提高智商,ZJY开始学习弦论。这一天,她在《 String theory》中看到了这样一道问题:对于一个给定的长度为n的字符串,求出它的第k小子串是什么。你能帮帮她吗?
Input
第一行是一个仅由小写英文字母构成的字符串s
第二行为两个整数t和k,t为0则表示不同位置的相同子串算作一个,t为1则表示不同位置的相同子串算作多个。k的意义见题目描述。
Output
输出数据仅有一行,该行有一个字符串,为第k小的子串。若子串数目不足k个,则输出-1。
题解:
相信T=0,大家都会做,这是后缀数组的一个经典问题。
具体就是,每个子串都是一个后缀的前缀。
从头到尾扫,每个后缀都会有 $n-sa[i]+1-height[i]$ 个本质不同的子串,即可。
重点是T=1时,怎么用后缀数组解决?
由于我比较菜,我想了一个大暴力,一位一位的枚举!
因为我们前面的字母是确定的,那么当前面的字母一样的时候,后面一个字母一定是单调不下降的。
那我们就能二分求出这个字母最后一个的位置。
我们建一个后缀长度的前缀和,那我们就能求出以这个字母开头的子串有多少个。
当个数大于$k$时,就确定了这个字母,否则$k$减去,继续枚举下一个字母。
枚举完一位继续下一位,那我们就能把范围缩小,知道求出答案。
具体看代码……
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std; int n,t,k;
long long sum[];
char s[];
struct SA{
char s[];
int tp[],rak[];
int tax[],sa[];
int n,m,height[];
void build(char str[]){
memcpy(s,str,sizeof(s));
n=strlen(s+);
build_sa(rak,tp);
build_height();
}
void sort(int a[],int b[]){
for(int i=;i<=m;i++)tax[i]=;
for(int i=;i<=n;i++)tax[a[i]]++;
for(int i=;i<=m;i++)tax[i]+=tax[i-];
for(int i=n;i>=;i--)sa[tax[a[b[i]]]--]=b[i];
}
bool comp(int r[],int a,int b,int k){
return r[a]==r[b]&&r[a+k]==r[b+k];
}
void build_sa(int a[],int b[]){
for(int i=;i<=n;i++)
m=max(m,a[i]=s[i]-'a'+),b[i]=i;
sort(a,b);
for(int p=,j=;p<n;j<<=,m=p){
p=;
for(int i=;i<=j;i++)b[++p]=n-j+i;
for(int i=;i<=n;i++)if(sa[i]>j)b[++p]=sa[i]-j;
sort(a,b);
int *t=a;a=b;b=t;
a[sa[]]=p=;
for(int i=;i<=n;i++)
a[sa[i]]=comp(b,sa[i],sa[i-],j)?p:++p;
}
for(int i=;i<=n;i++)rak[sa[i]]=i;
}
void build_height(){
for(int i=,j=;i<=n;i++){
if(j)j--;
while(s[i+j]==s[sa[rak[i]-]+j])j++;
height[rak[i]]=j;
}
}
}a; int main(){
scanf("%s%d%d",s+,&t,&k);
a.build(s);
n=strlen(s+);
if(t==){
for(int i=;i<=n;i++){
int c=n-a.sa[i]+-a.height[i];
if(k<=c){
for(int j=a.sa[i];j<=a.sa[i]+a.height[i]+k-;j++)
putchar(s[j]);
return ;
}else k-=c;
}
printf("-1");
}else{
for(int i=;i<=n;i++) //处理前缀和
sum[i]=sum[i-]+n-a.sa[i]+;
if(sum[n]<k)return printf("-1"),; //子串不够输出-1
int L=,R=n;
for(int i=;i<=n;i++){
int tmp=L;
for(int j='a';j<='z';j++){ //枚举 a~z
int l=tmp,r=R;
while(l<=r){ //二分找这个字母的最后一个位置
int mid=l+r>>;
if(s[a.sa[mid]+i-]>j)r=mid-;
else l=mid+;
}
long long t=sum[r]-sum[tmp-]-1LL*(r-tmp+)*(i-);
//现在枚举的区间有多少个子串
//减是因为减去前面枚举过得位置
if(k<=r-tmp+){
//现在要查的比现在字母的个数少,说明这个字母就是结束的位置
for(int j=a.sa[tmp];j<=a.sa[tmp]+i-;j++)
putchar(s[j]);
return ;
}
if(t>=k){ //说明这位就是这个字母,减去字母个数
L=tmp,R=r;
k-=r-tmp+;
break;
}
tmp=r+,k-=t; //不是,继续枚举
}
if(n-a.sa[L]+==i)L++; //如果下一位为空,就不用算了。
}
}
}
【TJOI2015】弦论 (后缀数组)的更多相关文章
- 【BZOJ3998】[TJOI2015]弦论 后缀自动机
[BZOJ3998][TJOI2015]弦论 Description 对于一个给定长度为N的字符串,求它的第K小子串是什么. Input 第一行是一个仅由小写英文字母构成的字符串S 第二行为两个整数T ...
- BZOJ 3998: [TJOI2015]弦论 [后缀自动机 DP]
3998: [TJOI2015]弦论 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2152 Solved: 716[Submit][Status] ...
- [bzoj3998][TJOI2015]弦论-后缀自动机
Brief Description 给定一个字符串, 您需要求出他的严格k小子串或非严格k小子串. Algorithm Design 考察使用后缀自动机. 首先原串建SAM, 然后如果考察每个状态代表 ...
- BZOJ 3998: [TJOI2015]弦论 后缀自动机 后缀自动机求第k小子串
http://www.lydsy.com/JudgeOnline/problem.php?id=3998 后缀自动机应用的一个模板?需要对len进行一个排序之后再统计每个出现的数量,维护的是以该字符串 ...
- BZOJ 3998 TJOI2015 弦论 后缀自动机+DAG上的dp
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3998 题意概述:对于一个给定长度为N的字符串,求它的第K小子串是什么,T为0则表示不同位置 ...
- 【bzoj3998】[TJOI2015]弦论 后缀自动机+dp
题目描述 对于一个给定长度为N的字符串,求它的第K小子串是什么. 输入 第一行是一个仅由小写英文字母构成的字符串S 第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个.T=1则表示不同位置 ...
- BZOJ 3998 [TJOI2015]弦论 ——后缀自动机
直接构建后缀自动机. 然后. 然后只需要再后缀自动机的go树上类似二分的方法进行查找即可,实际上是“26分”. 然后遇到了处理right集合的问题,然后觉得在go和parent树上上传都是可以的,毕竟 ...
- [TJOI2015]弦论(后缀自动机)
/* 一道在树上乱搞的题目 建立出parent树来, 然后就能搞出每个节点往后能扩展出几个串, 至于位置不同算同一个的话就强制让right集合大小为1即可 然后在树上类比权值线段树找第k大26分统计一 ...
- BZOJ.3998.[TJOI2015]弦论(后缀自动机)
题目链接 \(Description\) 给定字符串S,求其第K小子串.(若T=0,不同位置的相同子串算1个:否则算作多个) \(Solution\) 建SAM,处理出对于每个节点,它和它的所有后继包 ...
- bzoj 3998 [TJOI2015]弦论——后缀自动机
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3998 相同子串算多个的话,先求好 right ,然后求一个 sm 表示走到这个点之后有几种走 ...
随机推荐
- gravity 使用操作。
gravity 使用操作.最近我司有一个比较奇葩的需求,我们的环境是主从,因为数据量较大会定期的删除数据,最近不行了,要求新建出来一个库 同步正事环境的数据,但是要剔除 delete ,drop,tr ...
- String&StringBuffer&StringBuilder区别
String String类是final类故不可以继承,也就意味着String引用的字符串内容是不能被修改.String有两种实例化方式: (1)直接赋值(例中,String str = &q ...
- js时间转换
1. 将时间戳转换成日期格式 // 简单的一句代码 var date = new Date(时间戳); //获取一个时间对象 /** 1. 下面是获取时间日期的方法,需要什么样的格式自己拼接起来就好了 ...
- SSM(Spring+Spring MVC+Mybatis)开发前台后功能完整的java开源博客管理系统
项目描述 本项目通过SSM(SpringMVC+Mybatis+Spring)框架编写的一个人博客管理系统,使用hexo主题,以及MAVEN进行对项目管理,并且前端具有粒子和点击爱心效果.后端的页面框 ...
- Laravel — homestead 配置多站点
一.homestead.yaml 配置 homestead.yaml 文件配置sites,如下 sites: - map: homestead.test to: /home/vagrant/Code/ ...
- 07.VUE学习之解决phpstorm不识别ECMASCRIPT6语法的问题
此时已经识别:
- Python知识点入门笔记——基本运算和表达式
变量:Python的变量不需要单独定义,直接在赋值的过程中完成定义. 当直接运行一个没有赋值过的变量时,会报错. 当不需要某个变量时,可以用del来删除 每个变量都占据着一定的内存空间,当变量被删除了 ...
- day 71 Django基础六之ORM中的锁和事务
Django基础六之ORM中的锁和事务 本节目录 一 锁 二 事务 三 xxx 四 xxx 五 xxx 六 xxx 七 xxx 八 xxx 一 锁 行级锁 select_for_update(no ...
- python爬虫入门八:多进程/多线程
什么是多线程/多进程 引用虫师的解释: 计算机程序只不过是磁盘中可执行的,二进制(或其它类型)的数据.它们只有在被读取到内存中,被操作系统调用的时候才开始它们的生命期. 进程(有时被称为重量级进程)是 ...
- (转)curl常用命令
本文转自 http://www.cnblogs.com/gbyukg/p/3326825.html 下载单个文件,默认将输出打印到标准输出中(STDOUT)中 curl http://www.cent ...