给定一个长度为\(n(n\le 5\times 10^5)\)的字符串,求它的第\(k\)小字串。有两种模式:

  • \(Type=0\),不同位置的相同字串只算一个
  • \(Type=1\),不同位置相同字串算多个

Sample Input

aabc
0 3

Sample Output

aab

分析

我们知道,后缀自动机的从小到大遍历可以按顺序得到字符串的所有子串,所以要得到第\(k\)小的字串,只要用类似线段树上二分的做法,记录每一个出去的边后面有多少个即可。记\(val[i]\)为每个点的值,只要求一下\(sum[i]=val[i]+\sum _{trans(i,x)}sum[x]\)。对于两种不同的模式,我们对于\(val\)的设置不同。对于\(type=0\),我们把每个点的\(val\)始终为1,对于\(type=1\),初始时我们把\(val\)设为1,每次新加点的时候,把这个点的整条suffix-link上的点的\(val\)都加一,因为suffix-link代表的是后缀,形成了一个新的字符串后所有后缀的出现次数都增多了,由于一样的子串出现多次算多次,我们要给它算进去。最后dfs一下沿着路查找输出就好啦。很简单的题。

计算\(sum\)的时候,我用的方法是直接dfs一次,而这样会爆栈,所以我手工开栈了。还有一种方法,可以不需要dfs即可解决。我们知道,后缀自动机的\(trans\)组成了一个有向无环图,并且每个点代表的\(len\)与它们的拓扑序相符,而且\(len\)的大小不会超过\(n\),所以我们可以直接对\(len\)进行一次基数排序,相当于完成了拓扑排序,再按照拓扑倒序更新\(sum\)值。这种方法完全不需要递归,就不需要手工开栈了。复杂度同样是\(O(n)\)的。

代码

学一下手工开栈的方法。

更正:bzoj上提交不开栈也能过,因为系统是linux

#include<cstdio>
#include<cctype>
#include<cstring>
#include<cstdlib>
using namespace std;
int read() {
int x=0,f=1;
char c=getchar();
for (;!isdigit(c);c=getchar()) if (c=='-') f=-1;
for (;isdigit(c);c=getchar()) x=x*10+c-'0';
return x*f;
}
const int maxn=5e5+1;
const int maxc=26;
char s[maxn];
int sta[maxn<<2],top=0;
bool alr[maxn<<1];
struct SAM {
int t[maxn<<1][maxc],len[maxn<<1],link[maxn<<1],val[maxn<<1],sum[maxn<<1],last,tot;
SAM ():last(1),tot(1) {}
void add(int x,int T) {
int nw=++tot,i;
len[nw]=len[last]+1;
val[nw]=1;
for (i=last;i && !t[i][x];i=link[i]) t[i][x]=nw;
if (i) {
int p=t[i][x];
if (len[p]==len[i]+1) link[nw]=p; else {
int q=++tot;
val[q]=val[p];
len[q]=len[i]+1;
memcpy(t[q],t[p],sizeof t[p]);
for (int j=i;j && t[j][x]==p;j=link[j]) t[j][x]=q;
link[q]=link[p];
link[p]=link[nw]=q;
}
} else link[nw]=1;
if (T) for (int i=link[nw];i;i=link[i]) ++val[i];
last=nw;
}
void dfs(int x) {
sum[x]=val[x];
for (int i=0;i<maxc;++i) if (t[x][i]) {
int v=t[x][i];
if (!alr[v]) {
alr[v]=true;
dfs(v);
}
sum[x]+=sum[v];
}
}
bool run(int x,int k) {
if (!k) return false;
for (int i=0;i<maxc;++i) if (t[x][i]) {
int v=t[x][i];
if (k>sum[v]) k-=sum[v]; else {
putchar(i+'a');
return run(v,k-val[v]);
}
}
return true;
}
} sam;
int main() {
int size=128<<20;
char *p=size+(char*)malloc(size);
__asm__("movl %0, %%esp\n" :: "r"(p)); #ifndef ONLINE_JUDGE
freopen("test.in","r",stdin);
freopen("my.out","w",stdout);
#endif
scanf("%s",s+1);
int n=strlen(s+1);
int T=read(),k=read();
for (int i=1;i<=n;++i) sam.add(s[i]-'a',T);
sam.dfs(1);
int ret=sam.run(1,k);
if (ret) puts("-1"); else puts("");
return 0;
}

bzoj3998-弦论的更多相关文章

  1. BZOJ3998 弦论 【SAM】k小子串

    BZOJ3998 弦论 给一个字符串,问其第\(K\)小字串是什么 两种形式 1.不同起始位置的相同串只算一次 2.不同起始位置的相同串各算一次 首先建\(SAM\) 所有串的数量就是\(SAM\)中 ...

  2. 【BZOJ3998】弦论(后缀自动机)

    [BZOJ3998]弦论(后缀自动机) 题面 BZOJ 题解 这题应该很简单 构建出\(SAM\)后 求出每个点往后还能构建出几个串 按照拓扑序\(dp\)一些就好了 然后就是第\(k\)大,随便搞一 ...

  3. 【BZOJ3998】[TJOI2015]弦论 后缀自动机

    [BZOJ3998][TJOI2015]弦论 Description 对于一个给定长度为N的字符串,求它的第K小子串是什么. Input 第一行是一个仅由小写英文字母构成的字符串S 第二行为两个整数T ...

  4. [bzoj3998][TJOI2015]弦论_后缀自动机

    弦论 bzoj-3998 TJOI-2015 题目大意:给定一个字符串,求其$k$小子串. 注释:$1\le length \le 5\cdot 10^5$,$1\le k\le 10^9$. 想法: ...

  5. 【BZOJ-3998】弦论 后缀自动机

    3998: [TJOI2015]弦论 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2018  Solved: 662[Submit][Status] ...

  6. 【bzoj3998】 TJOI2015—弦论

    http://www.lydsy.com/JudgeOnline/problem.php?id=3998 (题目链接) 题意 给出一个字符串,求它的字典序第K小的子串是什么,分情况讨论不在同一位置的相 ...

  7. BZOJ3998 TJOI2015弦论(后缀数组+二分答案)

    先看t=1的情况.显然得求出SA(因为我不会SAM).我们一位位地确定答案.设填到了第len位,二分这一位填什么之后,在已经确定的答案所在的范围(SA上的某段区间)内二分,找到最后一个小于当前串的后缀 ...

  8. 【BZOJ3998】弦论 [SAM]

    弦论 Time Limit: 10 Sec  Memory Limit: 256 MB[Submit][Status][Discuss] Description 对于一个给定长度为N的字符串,求它的第 ...

  9. bzoj3998: [TJOI2015]弦论(SAM+dfs)

    3998: [TJOI2015]弦论 题目:传送门 题解: SAM的入门题目(很好的复习了SAM并加强Right集合的使用) 其实对于第K小的字符串直接从root开始一通DFS就好,因为son边是直接 ...

  10. bzoj3998: [TJOI2015]弦论

    SAM小裸题qwq #include <iostream> #include <cstdio> #include <cmath> #include <cstr ...

随机推荐

  1. 统一建模语言——UML

    一.UML概述 Unified Modeling Language (UML)又称统一建模语言或标准建模语言,是始于1997年一个OMG标准,它是一个支持模型化和软件系统开发的图形化语言,为软件开发的 ...

  2. js实现无限级分类

    let arr = [ {id:1,name:"php",pid:0}, {id:2,name:"php基础",pid:1}, {id:3,name:" ...

  3. Android 模拟器 下载、编译及调试

    Android 模拟器源码下载 Android 模拟器源码的下载与 Android AOSP 源码库的下载过程类似,可以参考 Google 官方提供的 Android 源码下载文档 来了解这个过程. ...

  4. android学习十一 高级调试分析功能

    1.debug 功能列表 2.ddms功能( 内存检查,线程检查,视图层次分析) 3.跟踪代码 TraceView 4.命令行工具 adb 5.策略检查StrictMode

  5. Selenium安装(二)

    安装python 安装Selenium之前首先来说一下Python,python是一门动态性语言,python的编写比较灵活,简洁,开发效率高.因此以python结合selenium来进行自动化测试. ...

  6. Dos命令以及相关文件的访问

    1.转到相关目录 有时候想从当前目录转到D盘,用此目录cd d:是没有用的, 最好用cd /d d:是可以的 2.查看目录文件 dir 3.往服务器上传文件文件 通过文件浏览器上传文件,只适用于Win ...

  7. C#使用EF连接PGSql数据库

    前言 由于项目需要,使用到了PGSql数据库,说实话这是第一次接触并且听说PGSql(PostgreSQL)关系型数据库,之前一直使用的都是SqlServer,一头雾水的各种找资源,终于将PGSql与 ...

  8. 看图写树 (Undraw the Trees UVA - 10562)

    题目描述: 原题:https://vjudge.net/problem/UVA-10562 题目思路: 递归找结点 //自己的代码测试过了,一直WA,贴上紫书的代码 AC代码 #include< ...

  9. Scala学习笔记之Actor多线程与线程通信的简单例子

    题目:通过子线程读取每个文件,并统计单词数,将单词数返回给主线程相加得出总单词数 package review import scala.actors.{Actor, Future} import s ...

  10. mac os x下应用endnote异常解决办法

    最近在用Office+Endnote写论文,使用拼音输入法换字时会出现重字和拼音的情况,比如我想打“桥连”,最终出现的是"qiao'lian桥lian桥连”.后来发现这个问题时由endnot ...