Mr. Panda and Fantastic Beasts

题意

给出若干个字符串,找到一个最短的字典序最小的字符串且仅是第一个字符串的子串。

分析

对于这种多个字符串、重复的子串问题一般都要连接字符串加后缀数组解决(当然也存在其它方法)。

用一个未出现的字符连接多个字符串,计算出后缀数组,枚举 \(sa\) 数组(\(sa\) 数组是按字典序排序的,保证我们选到的相同长度的子串一定是字典序最小的)。

如果枚举到的 \(sa\) 的首字母都属于第一个字符串,那么全部存起来,直到遇到其它字符串,我们用前面存起来的的值分别与前面最近的、后面最近的首字母不在第一个字符串的后缀串计算 \(LCP1, LCP2\) (这个可以用 \(ST\) 算法预处理),那么长度至少为是 \(max\{LCP1, LCP2\} + 1\),但是必须保证加上首字母的下标不超过第一个字符串的长度。

code

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<cmath>
typedef long long ll;
using namespace std;
const int MAXN = 5e5 + 10;
const int INF = 1e8;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,即最后一位为数字 0
int rnk[MAXN], height[MAXN];
// 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
void build_sa(int m) {
int i, *x = t, *y = t2;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = s[i]]++;
for(i = 1; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for(int k = 1; k <= n; k <<= 1) {
int p = 0;
for(i = n - k; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 0; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
if(p >= n) break;
m = p;
}
}
void getHeight() {
int i, j, k = 0;
for(i = 0; i < n; i++) rnk[sa[i]] = i;
for(i = 0; i < n - 1; i++) {
if(k) k--;
j = sa[rnk[i] - 1];
while(s[i + k] == s[j + k]) k++;
height[rnk[i]] = k;
}
}
int T, kase = 1;
char s2[MAXN];
int q[MAXN];
int dp[MAXN][30];
void init() {
for(int i = 0; i < n; i++) {
dp[i][0] = height[i];
}
for(int i = 1; (1 << i) < MAXN; i++) {
for(int j = 0; j < n; j++) {
dp[j][i] = min(dp[j][i - 1], dp[j + (1 << (i - 1))][i - 1]);
}
}
}
int query(int l, int r) {
if(l > r) swap(l, r);
l++;
int k = (int)(log((double)r - l + 1) / log(2.0));
return min(dp[l][k], dp[r - (1 << k) + 1][k]);
}
int main() {
scanf("%d", &T);
while(T--) {
int m;
scanf("%d", &m);
scanf("%s", s);
int L = strlen(s);
int k = L;
s[L++] = '$';
for(int i = 1; i < m; i++) {
scanf("%s", s2);
int l = strlen(s2);
for(int j = L; j < L + l; j++) {
s[j] = s2[j - L];
}
L += l;
s[L++] = '$';
}
s[L] = 0;
n = L + 1;
build_sa(128);
getHeight();
init();
int p = -1, len = 0, cnt = 0, pre = -1;
if(sa[1] < k) q[cnt++] = sa[1];
else pre = sa[1];
for(int i = 2; i < n; i++) {
while(i < n && sa[i] < k) {
q[cnt++] = sa[i];
i++;
}
if(i == n) break;
for(int j = 0; j < cnt; j++) {
int tmp1;
if((tmp1 = query(rnk[q[j]], rnk[sa[i]])) + q[j] < k) {
int tmp2;
if(pre != -1 && (tmp2 = query(rnk[q[j]], rnk[pre])) + q[j] < k) {
int tlen = max(tmp1, tmp2) + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
if(pre == -1) {
int tlen = tmp1 + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
}
}
cnt = 0;
if(sa[i] >= k) pre = sa[i];
}
for(int i = 0; i < cnt; i++) {
int tmp1;
if(pre != -1 && (tmp1 = query(rnk[q[i]], rnk[pre])) + q[i] < k) {
int tlen = tmp1 + 1;
if((q[i] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[i];
len = tlen;
}
}
}
printf("Case #%d: ", kase++);
if(p == -1) puts("Impossible");
else {
for(int i = p; i < p + len; i++) printf("%c", s[i]);
printf("\n");
}
}
return 0;
}

Gym - 101194F(后缀数组)的更多相关文章

  1. Gym - 102028H Can You Solve the Harder Problem? (后缀数组+RMQ+单调栈)

    题意:求一个序列中本质不同的连续子序列的最大值之和. 由于要求“本质不同”,所以后缀数组就派上用场了,可以从小到大枚举每个后缀,对于每个sa[i],从sa[i]+ht[i]开始枚举(ht[0]=0), ...

  2. 回文树&后缀自动机&后缀数组

    KMP,扩展KMP和Manacher就不写了,感觉没多大意思.   之前感觉后缀自动机简直可以解决一切,所以不怎么写后缀数组.   马拉车主要是通过对称中心解决问题,有的时候要通过回文串的边界解决问题 ...

  3. 2018 - 2019 CTU Open Contest E. Locker Room 【后缀数组】

    任意门:http://codeforces.com/gym/101954/problem/E E. Locker Room time limit per test 2.0 s memory limit ...

  4. 后缀数组的倍增算法(Prefix Doubling)

    后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...

  5. BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]

    4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...

  6. BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]

    1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec  Memory Limit: 64 MBSubmit: 1383  Solved: 582[Submit][St ...

  7. POJ3693 Maximum repetition substring [后缀数组 ST表]

    Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9458   Acc ...

  8. POJ1743 Musical Theme [后缀数组]

    Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 27539   Accepted: 9290 De ...

  9. 后缀数组(suffix array)详解

    写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...

随机推荐

  1. DOS程序员手册(十四)

    附录A ASCII字符集 十进制        十六进制      二进制              AscII         控制        按键 X10         X16        ...

  2. bat批处理 批量导出多个APK的AAPT信息(含python实现)

    产品APP因架构调整,将一个APK拆分成了十几个APK,这样每次打ROM前,都要一个个核对APK的AAPT信息 一个个APK去敲命令很繁琐,想到可以用BAT批处理调用AAPT命令一次将十几个APK的A ...

  3. unity生命周期

    1.静态构造函数 当程序集被加载的时候就被调用了,如果你的unity处于编辑状态时,此时你保存一个脚本(从而迫使重新编译),静态构造函数会立即被调用,因为unity加载了DLL.并且它将不会再次运行, ...

  4. LightGBM的并行优化--机器学习-周振洋

    LightGBM的并行优化 上一篇文章介绍了LightGBM算法的特点,总结起来LightGBM采用Histogram算法进行特征选择以及采用Leaf-wise的决策树生长策略,使其在一批以树模型为基 ...

  5. 第二节 PHPUnit测试的剖析

    现在,让我们仔细看看测试结构的样子. 让我们从一个简单的测试用例开始,它将显示基本的PHPUnit测试结构. 以下代码片段是测试用于排序数组的两个PHP函数的一个非常基本的示例:asort()用于对数 ...

  6. Spring 学习笔记(六)—— AOP的简单理解

    系统中的业务可以分为核心关注点和横切关注点. 核心关注点时业务处理的主要流程,而横切关注点是与核心业务无关但更为通用的业务. 各个横切关注点离散地穿插于核心业务之中,导致系统地每一个模块都与这些业务具 ...

  7. 更优雅的清除浮动float方法

    上篇文章是利用 :after 方法清除浮动float(作用于浮动元素的父元素上). ; } //为了兼容性,因为ie6/7不能使用伪类,所以加上此行代码. .outer:after {;;visibi ...

  8. Java9最受期待的5大新特性

    虽然Java9要等到明年才正式发布,但是现在网上已经有了各种各样的有关Java9新特性的文章了,今天小编也将为大家分享除了通常猜测之外的一些很值得期待的5个新特性. 1.Java + REPL = j ...

  9. hdu 2578 Dating with girls(1) (hash)

    Dating with girls(1) Time Limit: 6000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Oth ...

  10. Windows1小时后关机命令

    shutdown -s -t 3600 1.注销当前用户 shutdown - l 该命令只能注销本机用户,对远程计算机不适用. 2.关闭本地计算机 shutdown - s 3.重启本地计算机 sh ...