bzoj3998-弦论
给定一个长度为\(n(n\le 5\times 10^5)\)的字符串,求它的第\(k\)小字串。有两种模式:
- \(Type=0\),不同位置的相同字串只算一个
- \(Type=1\),不同位置相同字串算多个
Sample Input
aabc
0 3
Sample Output
aab
分析
我们知道,后缀自动机的从小到大遍历可以按顺序得到字符串的所有子串,所以要得到第\(k\)小的字串,只要用类似线段树上二分的做法,记录每一个出去的边后面有多少个即可。记\(val[i]\)为每个点的值,只要求一下\(sum[i]=val[i]+\sum _{trans(i,x)}sum[x]\)。对于两种不同的模式,我们对于\(val\)的设置不同。对于\(type=0\),我们把每个点的\(val\)始终为1,对于\(type=1\),初始时我们把\(val\)设为1,每次新加点的时候,把这个点的整条suffix-link上的点的\(val\)都加一,因为suffix-link代表的是后缀,形成了一个新的字符串后所有后缀的出现次数都增多了,由于一样的子串出现多次算多次,我们要给它算进去。最后dfs一下沿着路查找输出就好啦。很简单的题。
计算\(sum\)的时候,我用的方法是直接dfs一次,而这样会爆栈,所以我手工开栈了。还有一种方法,可以不需要dfs即可解决。我们知道,后缀自动机的\(trans\)组成了一个有向无环图,并且每个点代表的\(len\)与它们的拓扑序相符,而且\(len\)的大小不会超过\(n\),所以我们可以直接对\(len\)进行一次基数排序,相当于完成了拓扑排序,再按照拓扑倒序更新\(sum\)值。这种方法完全不需要递归,就不需要手工开栈了。复杂度同样是\(O(n)\)的。
代码
学一下手工开栈的方法。
更正:bzoj上提交不开栈也能过,因为系统是linux
#include<cstdio>
#include<cctype>
#include<cstring>
#include<cstdlib>
using namespace std;
int read() {
int x=0,f=1;
char c=getchar();
for (;!isdigit(c);c=getchar()) if (c=='-') f=-1;
for (;isdigit(c);c=getchar()) x=x*10+c-'0';
return x*f;
}
const int maxn=5e5+1;
const int maxc=26;
char s[maxn];
int sta[maxn<<2],top=0;
bool alr[maxn<<1];
struct SAM {
int t[maxn<<1][maxc],len[maxn<<1],link[maxn<<1],val[maxn<<1],sum[maxn<<1],last,tot;
SAM ():last(1),tot(1) {}
void add(int x,int T) {
int nw=++tot,i;
len[nw]=len[last]+1;
val[nw]=1;
for (i=last;i && !t[i][x];i=link[i]) t[i][x]=nw;
if (i) {
int p=t[i][x];
if (len[p]==len[i]+1) link[nw]=p; else {
int q=++tot;
val[q]=val[p];
len[q]=len[i]+1;
memcpy(t[q],t[p],sizeof t[p]);
for (int j=i;j && t[j][x]==p;j=link[j]) t[j][x]=q;
link[q]=link[p];
link[p]=link[nw]=q;
}
} else link[nw]=1;
if (T) for (int i=link[nw];i;i=link[i]) ++val[i];
last=nw;
}
void dfs(int x) {
sum[x]=val[x];
for (int i=0;i<maxc;++i) if (t[x][i]) {
int v=t[x][i];
if (!alr[v]) {
alr[v]=true;
dfs(v);
}
sum[x]+=sum[v];
}
}
bool run(int x,int k) {
if (!k) return false;
for (int i=0;i<maxc;++i) if (t[x][i]) {
int v=t[x][i];
if (k>sum[v]) k-=sum[v]; else {
putchar(i+'a');
return run(v,k-val[v]);
}
}
return true;
}
} sam;
int main() {
int size=128<<20;
char *p=size+(char*)malloc(size);
__asm__("movl %0, %%esp\n" :: "r"(p));
#ifndef ONLINE_JUDGE
freopen("test.in","r",stdin);
freopen("my.out","w",stdout);
#endif
scanf("%s",s+1);
int n=strlen(s+1);
int T=read(),k=read();
for (int i=1;i<=n;++i) sam.add(s[i]-'a',T);
sam.dfs(1);
int ret=sam.run(1,k);
if (ret) puts("-1"); else puts("");
return 0;
}
bzoj3998-弦论的更多相关文章
- BZOJ3998 弦论 【SAM】k小子串
BZOJ3998 弦论 给一个字符串,问其第\(K\)小字串是什么 两种形式 1.不同起始位置的相同串只算一次 2.不同起始位置的相同串各算一次 首先建\(SAM\) 所有串的数量就是\(SAM\)中 ...
- 【BZOJ3998】弦论(后缀自动机)
[BZOJ3998]弦论(后缀自动机) 题面 BZOJ 题解 这题应该很简单 构建出\(SAM\)后 求出每个点往后还能构建出几个串 按照拓扑序\(dp\)一些就好了 然后就是第\(k\)大,随便搞一 ...
- 【BZOJ3998】[TJOI2015]弦论 后缀自动机
[BZOJ3998][TJOI2015]弦论 Description 对于一个给定长度为N的字符串,求它的第K小子串是什么. Input 第一行是一个仅由小写英文字母构成的字符串S 第二行为两个整数T ...
- [bzoj3998][TJOI2015]弦论_后缀自动机
弦论 bzoj-3998 TJOI-2015 题目大意:给定一个字符串,求其$k$小子串. 注释:$1\le length \le 5\cdot 10^5$,$1\le k\le 10^9$. 想法: ...
- 【BZOJ-3998】弦论 后缀自动机
3998: [TJOI2015]弦论 Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 2018 Solved: 662[Submit][Status] ...
- 【bzoj3998】 TJOI2015—弦论
http://www.lydsy.com/JudgeOnline/problem.php?id=3998 (题目链接) 题意 给出一个字符串,求它的字典序第K小的子串是什么,分情况讨论不在同一位置的相 ...
- BZOJ3998 TJOI2015弦论(后缀数组+二分答案)
先看t=1的情况.显然得求出SA(因为我不会SAM).我们一位位地确定答案.设填到了第len位,二分这一位填什么之后,在已经确定的答案所在的范围(SA上的某段区间)内二分,找到最后一个小于当前串的后缀 ...
- 【BZOJ3998】弦论 [SAM]
弦论 Time Limit: 10 Sec Memory Limit: 256 MB[Submit][Status][Discuss] Description 对于一个给定长度为N的字符串,求它的第 ...
- bzoj3998: [TJOI2015]弦论(SAM+dfs)
3998: [TJOI2015]弦论 题目:传送门 题解: SAM的入门题目(很好的复习了SAM并加强Right集合的使用) 其实对于第K小的字符串直接从root开始一通DFS就好,因为son边是直接 ...
- bzoj3998: [TJOI2015]弦论
SAM小裸题qwq #include <iostream> #include <cstdio> #include <cmath> #include <cstr ...
随机推荐
- 统一建模语言——UML
一.UML概述 Unified Modeling Language (UML)又称统一建模语言或标准建模语言,是始于1997年一个OMG标准,它是一个支持模型化和软件系统开发的图形化语言,为软件开发的 ...
- js实现无限级分类
let arr = [ {id:1,name:"php",pid:0}, {id:2,name:"php基础",pid:1}, {id:3,name:" ...
- Android 模拟器 下载、编译及调试
Android 模拟器源码下载 Android 模拟器源码的下载与 Android AOSP 源码库的下载过程类似,可以参考 Google 官方提供的 Android 源码下载文档 来了解这个过程. ...
- android学习十一 高级调试分析功能
1.debug 功能列表 2.ddms功能( 内存检查,线程检查,视图层次分析) 3.跟踪代码 TraceView 4.命令行工具 adb 5.策略检查StrictMode
- Selenium安装(二)
安装python 安装Selenium之前首先来说一下Python,python是一门动态性语言,python的编写比较灵活,简洁,开发效率高.因此以python结合selenium来进行自动化测试. ...
- Dos命令以及相关文件的访问
1.转到相关目录 有时候想从当前目录转到D盘,用此目录cd d:是没有用的, 最好用cd /d d:是可以的 2.查看目录文件 dir 3.往服务器上传文件文件 通过文件浏览器上传文件,只适用于Win ...
- C#使用EF连接PGSql数据库
前言 由于项目需要,使用到了PGSql数据库,说实话这是第一次接触并且听说PGSql(PostgreSQL)关系型数据库,之前一直使用的都是SqlServer,一头雾水的各种找资源,终于将PGSql与 ...
- 看图写树 (Undraw the Trees UVA - 10562)
题目描述: 原题:https://vjudge.net/problem/UVA-10562 题目思路: 递归找结点 //自己的代码测试过了,一直WA,贴上紫书的代码 AC代码 #include< ...
- Scala学习笔记之Actor多线程与线程通信的简单例子
题目:通过子线程读取每个文件,并统计单词数,将单词数返回给主线程相加得出总单词数 package review import scala.actors.{Actor, Future} import s ...
- mac os x下应用endnote异常解决办法
最近在用Office+Endnote写论文,使用拼音输入法换字时会出现重字和拼音的情况,比如我想打“桥连”,最终出现的是"qiao'lian桥lian桥连”.后来发现这个问题时由endnot ...