BZOJ 3230 相似子串

题面

题解

首先我们要知道询问的两个子串的位置。

先正常跑一遍后缀数组并求出height数组。

对于每一个后缀suffix(i)，考虑以i开头的子串有多少是之前没有出现过的，也就是考虑左端点在i、右端点在什么范围内时这个子串没有出现过——答案是右端点在[i + height[i] - 1, n]范围内时这个子串没出现过，即右端点在没有被“i与排在前一个的后缀的公共前缀”覆盖的部分时，这个子串没有出现过。

那么我们记录以每个i开头的新子串的数量，求前缀和，然后询问的时候二分就知道询问的字符串的开头、结尾是谁了。

用已有的height结合st表可以求出两个字符串的最长公共前缀，把字符串倒过来再跑一遍后缀数组，就能求出最长公共后缀了。

注意：

注意两个询问字符串开头/结尾相同的情况。
注意第二个后缀数组是倒过来的。hack数据：2 1 aabc 1 2
注意子串个数爆int，需要开long long。

#include <cmath>

#include <cstdio>

#include <cstring>

#include <algorithm>

#define space putchar(' ')

#define enter putchar('\n')

using namespace std;

typedef long long ll;

template <class T>

void read(T &x){

    char c;

    bool op = 0;

    while(c = getchar(), c > '9' || c < '0')

        if(c == '-') op = 1;

    x = c - '0';

    while(c = getchar(), c >= '0' && c <= '9')

        x = x * 10 + c - '0';

    if(op) x = -x;

}

template <class T>

void write(T x){

    if(x < 0) putchar('-'), x = -x;

    if(x >= 10) write(x / 10);

    putchar('0' + x % 10);

}

const int N = 200005, INF = 0x3f3f3f3f;

char s[N];

int n, Q, buf1[N], buf2[N], sa[2][N], buc[N], rnk[2][N], height[2][N];

ll lg[N], st[2][N][20];

ll sum[N];

void suffix_sort(int t){

    int *x = buf1, *y = buf2, m = 127;

    for(int i = 0; i <= m; i++) buc[i] = 0;

    for(int i = 1; i <= n; i++) buc[x[i] = s[i]]++;

    for(int i = 1; i <= m; i++) buc[i] += buc[i - 1];

    for(int i = n; i; i--) sa[t][buc[x[i]]--] = i;

    for(int k = 1, p = 0; k <= n; k <<= 1, m = p, p = 0){

        for(int i = n - k + 1; i <= n; i++) y[++p] = i;

        for(int i = 1; i <= n; i++) if(sa[t][i] > k) y[++p] = sa[t][i] - k;

        for(int i = 0; i <= m; i++) buc[i] = 0;

        for(int i = 1; i <= n; i++) buc[x[y[i]]]++;

        for(int i = 1; i <= m; i++) buc[i] += buc[i - 1];

        for(int i = n; i; i--) sa[t][buc[x[y[i]]]--] = y[i];

        swap(x, y), x[sa[t][1]] = p = 1;

        for(int i = 2; i <= n; i++)

            if(y[sa[t][i]] == y[sa[t][i - 1]] && y[sa[t][i] + k] == y[sa[t][i - 1] + k]) x[sa[t][i]] = p;

            else x[sa[t][i]] = ++p;

        if(p >= n) break;

    }

    for(int i = 1; i <= n; i++) rnk[t][sa[t][i]] = i;

    for(int i = 1, k = 0; i <= n; i++){

        if(rnk[t][i] == 1) continue;

        if(k) k--;

        int j = sa[t][rnk[t][i] - 1];

        while(i + k <= n && j + k <= n && s[i + k] == s[j + k]) k++;

        height[t][rnk[t][i]] = k;

    }

}

void init(){

    for(int i = 1, j = 0; i <= n; i++)

        lg[i] = i == (1 << (j + 1)) ? ++j : j;

}

void st_init(int k){

    for(int i = 1; i <= n; i++) st[k][i][0] = height[k][i];

    for(int j = 1; (1 << j) <= n; j++)

        for(int i = 1; i + (1 << j) - 1 <= n; i++)

            st[k][i][j] = min(st[k][i][j - 1], st[k][i + (1 << (j - 1))][j - 1]);

}

ll getmin(int k, int l, int r){

    if(l == r) return INF;

    if(l > r) swap(l, r);

    int j = lg[r - l];

    return min(st[k][l + 1][j], st[k][r - (1 << j) + 1][j]);

}

int main(){

    read(n), read(Q);

    scanf("%s", s + 1);

    init();

    suffix_sort(0);

    st_init(0);

    for(int i = 1, j = n; i < j; i++, j--) swap(s[i], s[j]);

    suffix_sort(1);

    st_init(1);

    for(int i = 1; i <= n; i++) sum[i] = sum[i - 1] + n - sa[0][i] + 1 - height[0][i];

    while(Q--){

        ll a, b, al, bl, ar, br;

        read(a), read(b);

        if(a > sum[n] || b > sum[n]){

            puts("-1");

            continue;

        }

        al = lower_bound(sum + 1, sum + n + 1, a) - sum;

        bl = lower_bound(sum + 1, sum + n + 1, b) - sum;

        ar = rnk[1][n - (sa[0][al] + height[0][al] - 1 + a - sum[al - 1]) + 1];

        br = rnk[1][n - (sa[0][bl] + height[0][bl] - 1 + b - sum[bl - 1]) + 1];

        ll len = min(n - sa[1][ar] + 1 - sa[0][al] + 1, n - sa[1][br] + 1 - sa[0][bl] + 1);

        ll x = min(len, getmin(0, al, bl));

        ll y = min(len, getmin(1, ar, br));

        printf("%lld\n", x * x + y * y);

    }

    return 0;

}

BZOJ 3230 相似子串 | 后缀数组二分 ST表的更多相关文章

bzoj 3230 相似子串 —— 后缀数组+二分
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3230 先算出每个后缀贡献子串的区间: 然后前缀LCP直接查询,后缀LCP二分长度,查询即可: ...
BZOJ3230 相似子串[后缀数组+二分+st表]
BZOJ3230 相似子串给一个串,查询排名i和j的子串longest common suffix和longest common prefix 思路其实还是蛮好想的,就是码起来有点恶心.可以发现后缀 ...
[BZOJ4310] 跳蚤 - 后缀数组,二分,ST表
[BZOJ4310] 跳蚤 Description 首先,他会把串分成不超过 \(k\) 个子串,然后对于每个子串 \(S\) ,他会从 \(S\) 的所有子串中选择字典序最大的那一个,并在选出来的 ...
bzoj 3230 相似子串——后缀数组
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3230 作出后缀数组,从 LCP 看每个位置对于本质不同子串的贡献,而且他们已经按前面部分排好 ...
BZOJ 3230 相似子串 ——后缀数组
题目的Source好有趣. 我们求出SA,然后求出每一个后缀中与前面本质不同的字符串的个数. 然后二分求出当前的字符串. 然后就是正反两次后缀数组求LCP的裸题了. 要注意,这时两个串的起点可能会相同 ...
BZOJ 3230: 相似子串(后缀数组)
传送门解题思路其实题目挺好想的.首先子串排名可以由后缀数组求得,因为不算重复的,所以后缀数组的每个后缀排名的去掉\(lcp\)的前缀排名为当前后缀的子串排名.这样就可以预处理出每个后缀的\(l,r ...
BZOJ 4278: [ONTAK2015]Tasowanie (后缀数组 / 二分+hash)
直接归并,然后如果哪边的后缀字典序比较小就去哪边,然后就可以后缀数组博客传送门- 但是本蒟蒻不会后缀数组 Upd:Upd:Upd:现在会了233.一道差不多的题:BZOJ 1692: [Usaco2 ...
BZOJ 1396: 识别子串( 后缀数组 + 线段树 )
这道题各位大神好像都是用后缀自动机做的?.....蒟蒻就秀秀智商写一写后缀数组解法..... 求出Height数组后, 我们枚举每一位当做子串的开头. 如上图(x, y是height值), Heigh ...
【BZOJ3230】相似子串后缀数组+二分+RMQ
[BZOJ3230]相似子串 Description Input 输入第1行,包含3个整数N,Q.Q代表询问组数.第2行是字符串S.接下来Q行,每行两个整数i和j.(1≤i≤j). Output 输出 ...

随机推荐

利用workbench对linux/Ubuntu系统中的mysql数据库进行操作
在上一篇文章中,我分享了在linux中如何安装mysql数据库,但是这只是安装了mysql的服务,并没有图形化管理界面,所以这样子操作起来并没有那么方便,那么现在我们就来实现如何利用在window中安 ...
[Lua] try catch实现
参考了https://blog.csdn.net/waruqi/article/details/53649634这里的代码,但实际使用时还有些问题,修改后在此记录一下. -- 异常捕获 functio ...
Python构建web应用（进阶版）->对网页HTML优化逻辑显示
本篇是承接上一篇web应用(入门级)的内容往下顺延的,阅读后将会了解HTML逻辑显示优化,如下图所示,从杂乱无章的日志文件到一个整齐的列表显示. —————————————————————————— ...
可道云kodexplorer搭建私有云后的配置优化
一.上传下载速度优化首先明确可道云没有对上传下载做任何限制,速度快慢和网络环境有关.可道云是基于http上传,所以和其他http上传速度基本一致:可以对比其他web系统或网站说附件上传速度.同其他例如 ...
docker中创建MySQL及在外部使用Navicat连接
1:获取MySQL镜像运行 docker pull mysql [root@MyCentos7- ~]# docker pull mysql Using default tag: latest la ...
Workbook对象的方法总结（一）
import openpyxlwb=openpyxl.Workbook()print('1.添加前所有工作簿的名称是:',wb.get_sheet_names())wb.create_sheet('F ...
华为笔试——C++最高分问题
题目介绍:现在输入一组数据,写入学生的考试分数.已知学生数为N,学生编号为1到N,且0<N<=30000,每个学生都有一个分数:操作数为M且0<M<5000.输入第一行为N M ...
Python发送邮件(最全)
简单邮件传输协议(SMTP)是一种协议,用于在邮件服务器之间发送电子邮件和路由电子邮件. Python提供smtplib模块,该模块定义了一个SMTP客户端会话对象,可用于使用SMTP或ESMTP侦听 ...
LeetCode 566. Reshape the Matrix (C++)
题目: In MATLAB, there is a very useful function called 'reshape', which can reshape a matrix into a n ...
Daily Scrum (2015/10/26)
今晚由于我们组成员就团队Week5作业的个人贡献分开会协商,所以把今天的编码工作往后延迟了.考虑到有些成员代码还没理解够,正好TFS的代码阅读分配的工作时间还没进行完,所以在会议之后我们让成员回寝自由 ...

BZOJ 3230 相似子串 | 后缀数组 二分 ST表

BZOJ 3230 相似子串

题面

题解

BZOJ 3230 相似子串 | 后缀数组 二分 ST表的更多相关文章

随机推荐

热门专题

BZOJ 3230 相似子串 | 后缀数组二分 ST表

BZOJ 3230 相似子串 | 后缀数组二分 ST表的更多相关文章