HDU5008 Boring String Problem(后缀数组)
练习一下字符串,做一下这道题。
首先是关于一个字符串有多少不同子串的问题,串由小到大排起序来应该是按照sa[i]的顺序排出来的产生的。
好像abbacd,排序出来的后缀是这样的
1---abbacd 第一个串产生的6个前缀都是新的子串
2---acd 第二个串除了和上一个串的前缀1 3-1=2 产生了2个子串
3---bacd 4-0=4
4---bbacd 5-1=4
5---cd 2-0=0
6---d 1-0=0
所以所有不同的前缀应该是(len-sa[i])-lcp[i-1]的和,即串长减去与上一个串的最长公共前缀,然后求和。
所以我们可以预处理出dp[i]表示sa[i]的后缀所产生的新串的个数,然后对dp[i]求一次前缀和,那么每次询问第k大的串的时候就可以直接lower_bound,找出串的左端和右端。但是这个(l,r)不一定是最小的,最小的可能是在sa[i+1]..sa[i+2]...里产生,所以我们首先要二分出合法的sa边界,即sa[i]....sa[j]里都可以产生的这个串,然后sa[i]...sa[j]的最小值即是我们要求的。写二分总是要跪要跪的- -0
#include <iostream>
#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
#include <string>
#include <numeric>
#include <cassert>
using namespace std; #define maxn 120000
#define ll long long struct SuffixArray
{
int n;
int m[2][maxn];
int sa[maxn];
char s[maxn]; void indexSort(int sa[], int ord[], int id[], int nId){
static int cnt[maxn];
memset(cnt, 0, sizeof(0)*nId);
for (int i = 0; i < n; i++){
cnt[id[i]]++;
}
partial_sum(cnt, cnt + nId, cnt);
for (int i = n - 1; i >= 0; i--){
sa[--cnt[id[ord[i]]]] = ord[i];
}
} int *id, *oId; void init(){
n = strlen(s) + 1;
static int w[maxn];
for (int i = 0; i <= n; i++) w[i] = s[i];
sort(w, w + n);
int nId = unique(w, w + n) - w;
id = m[0], oId = m[1];
for (int i = 0; i < n; i++){
id[i] = lower_bound(w, w + nId, s[i]) - w;
}
static int ord[maxn];
for (int i = 0; i < n; i++){
ord[i] = i;
}
indexSort(sa, ord, id, nId);
for (int k = 1; k <= n&&nId < n; k <<= 1){
int cur = 0;
for (int i = n - k; i < n; i++){
ord[cur++] = i;
}
for (int i = 0; i < n; i++){
if (sa[i] >= k) ord[cur++] = sa[i] - k;
}
indexSort(sa, ord, id, nId);
cur = 0;
swap(oId, id);
for (int i = 0; i < n; i++){
int c = sa[i], p = i ? sa[i - 1] : 0;
id[c] = (i == 0 || oId[c] != oId[p] || oId[c + k] != oId[p + k]) ? cur++ : cur - 1;
}
nId = cur;
}
} // lcp relevant
int rk[maxn], lcp[maxn];
void getlcp(){
for (int i = 0; i < n; i++) rk[sa[i]] = i;
int h = 0;
lcp[0] = 0;
for (int i = 0; i < n; i++){
int j = sa[rk[i] - 1];
for (h ? h-- : 0; i + h < n&&j + h < n&&s[i + h] == s[j + h]; h++);
lcp[rk[i] - 1] = h;
}
} // lcp query relevant
int d[maxn + 50][25];
int mi[maxn+50][25]; void getrmq(){
for (int i = 0; i < n; i++) d[i][0] = lcp[i];
for (int j = 1; (1 << j) < n; j++){
for (int i = 0; (i + (1 << j) - 1) < n; i++){
d[i][j] = min(d[i][j - 1], d[i + (1 << (j - 1))][j - 1]);
}
}
for(int i=0;i<n;i++) mi[i][0]=sa[i];
for (int j = 1; (1 << j) < n; j++){
for (int i = 0; (i + (1 << j) - 1) < n; i++){
mi[i][j] = min(mi[i][j - 1], mi[i + (1 << (j - 1))][j - 1]);
}
}
} int rmq_query3(int l,int r){
if(l==r) return mi[l][0];
int k=0;int len=r-l+1;
while((1<<(k+1))<len) ++k;
return min(mi[l][k], mi[r - (1 << k) + 1][k]);
} int rmq_query(int l, int r){
if(l==r) return n-1-sa[l];
if (l > r) swap(l, r); r -= 1;
int k = 0; int len = r - l + 1;
while ((1 << (k + 1)) < len) k++;
return min(d[l][k], d[r - (1 << k) + 1][k]);
} int rmq_query2(int l, int r){
l = rk[l], r = rk[r];
if (l > r) swap(l, r); r -= 1;
int k = 0; int len = r - l + 1;
while ((1 << (k + 1)) < len) k++;
return min(d[l][k], d[r - (1 << k) + 1][k]);
}
}sa; int nQ;
ll dp[maxn];
int n;
int main()
{
while(~scanf("%s",sa.s)){
sa.init();
sa.getlcp();
sa.getrmq();
n=sa.n-1;
dp[0]=0;
for(int i=1;i<=n;++i){
dp[i]=n-sa.sa[i]-sa.lcp[i-1];
dp[i]+=dp[i-1];
}
ll ansl=0,ansr=0;
ll ki;
scanf("%d",&nQ);
while(nQ--){
scanf("%I64d",&ki);
ki=(ki^ansl^ansr)+1;
if(ki>dp[n]){
ansl=ansr=0;
printf("%d %d\n",ansl,ansr);
continue;
}
int tl,tr;
int id=lower_bound(dp,dp+n+1,ki)-dp;
tl=sa.sa[id];
tr=tl+sa.lcp[id-1]+ki-dp[id-1]-1;
int len=tr-tl+1;
int lf=id,rf=n;
while(lf<rf){
int mid=(lf+rf+1)>>1;
if(sa.rmq_query(id,mid) >= len) lf=mid;
else rf=mid-1;
}
ansl=sa.rmq_query3(id,lf)+1;
ansr=ansl+len-1;
printf("%I64d %I64d\n",ansl,ansr);
}
}
return 0;
}
HDU5008 Boring String Problem(后缀数组)的更多相关文章
- HDU - 5008 Boring String Problem (后缀数组+二分法+RMQ)
Problem Description In this problem, you are given a string s and q queries. For each query, you sho ...
- HDU 5008 Boring String Problem(后缀数组+二分)
题目链接 思路 想到了,但是木写对啊....代码 各种bug,写的乱死了.... 输出最靠前的,比较折腾... #include <cstdio> #include <cstring ...
- HDU5008 Boring String Problem(后缀数组 + 二分 + 线段树)
题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=5008 Description In this problem, you are given ...
- HDOJ 5008 Boring String Problem
后缀数组+RMQ+二分 后缀数组二分确定第K不同子串的位置 , 二分LCP确定可选的区间范围 , RMQ求范围内最小的sa Boring String Problem Time Limit: 6000 ...
- 【HDU 5030】Rabbit's String (二分+后缀数组)
Rabbit's String Problem Description Long long ago, there lived a lot of rabbits in the forest. One d ...
- HDU 6194 string string string(后缀数组+RMQ)
string string string Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Oth ...
- HDU 3518 Boring counting(后缀数组,字符处理)
题目 参考自:http://blog.sina.com.cn/s/blog_64675f540100k9el.html 题目描述: 找出一个字符串中至少重复出现两次的字串的个数(重复出现时不能重叠). ...
- HDU 5008 Boring String Problem
题意:给定一个串长度<=1e5,将其所有的不同的字串按照字典序排序,然后q个询问,每次询问字典序第k小的的起始坐标,并且起始坐标尽量小. 分析: 一开始看错题意,没有意识到是求不同的字串中第k小 ...
- Gym - 102028H Can You Solve the Harder Problem? (后缀数组+RMQ+单调栈)
题意:求一个序列中本质不同的连续子序列的最大值之和. 由于要求“本质不同”,所以后缀数组就派上用场了,可以从小到大枚举每个后缀,对于每个sa[i],从sa[i]+ht[i]开始枚举(ht[0]=0), ...
随机推荐
- hdu 5412 CRB and Queries
题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=5412 CRB and Queries Description There are $N$ boys i ...
- 简述afinal 框架的基本用法
本文只是对afinal做简单的描述,基本和git上给的文档一样,大神绕道! FinalDB模块本文为涉及到 FinalActivity模块,FinalHttp模块,FinalBitmap模块 代码体 ...
- netlink+netfilter
http://blog.chinaunix.net/uid-21768364-id-3618377.html
- 代码编译方式 ant +ivy
Apache Ant,是一个将软件编译.测试.部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发.由Apache软件基金会所提供. 没用过ant,了解一下,无非就这些功能, 编 ...
- wordpress 为文章内容添加自动过滤,例如为出站链接添加nofollow,也可以将淘宝客链接转换。。
做seo的都明白,反向链接对与网站的优化有着很重要的作用,是搜索引擎给网站排名的一个重要因素.为了添加反向链接,SEO作弊者会在论坛和博客等大量发布带无关链接的 内容.这些垃圾链接的存在给搜索引擎对网 ...
- QT实现软件重启
//重启软件 void MainWindow::on_pushButton_UI_reboot_clicked() { //方式1 需要主函数中事件循环判断 //qApp->exit(773); ...
- matlab 函数的编写与调用
matlab中写个函数,在主程序中调用该函数的方法 跟其它的编程语言都一样,但是子函数与主函数要存于不同的文件中,文件名就是函数名字.文件必须保存在current directory中,才能调用. 函 ...
- java rest框架jersey数组单记录问题解决
JAVA数据接口采用jersey技术,可以返回xml,json等格式,可以根据客户端请求accept,如:Application/json,Application/xml 来得到不同的接口数据,非常好 ...
- Notes of the scrum meeting(12.7)
meeting time:18:30~19:10p.m.,December 7th,2013 meeting place:3号公寓一层 attendees: 顾育豪 ...
- 结对开发----找出“水王"
一.题目 三人行设计了一个灌水论坛.信息学院的学生都喜欢在上面交流灌水,传说在论坛上有一个“水王”,他不但喜欢发帖,还会回复其他ID发的每个帖子.坊间风闻该“水王”发帖数目超过了帖子数目的一半. 如果 ...