Gym - 101194F(后缀数组)
Mr. Panda and Fantastic Beasts
题意
给出若干个字符串,找到一个最短的字典序最小的字符串且仅是第一个字符串的子串。
分析
对于这种多个字符串、重复的子串问题一般都要连接字符串加后缀数组解决(当然也存在其它方法)。
用一个未出现的字符连接多个字符串,计算出后缀数组,枚举 \(sa\) 数组(\(sa\) 数组是按字典序排序的,保证我们选到的相同长度的子串一定是字典序最小的)。
如果枚举到的 \(sa\) 的首字母都属于第一个字符串,那么全部存起来,直到遇到其它字符串,我们用前面存起来的的值分别与前面最近的、后面最近的首字母不在第一个字符串的后缀串计算 \(LCP1, LCP2\) (这个可以用 \(ST\) 算法预处理),那么长度至少为是 \(max\{LCP1, LCP2\} + 1\),但是必须保证加上首字母的下标不超过第一个字符串的长度。
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<cmath>
typedef long long ll;
using namespace std;
const int MAXN = 5e5 + 10;
const int INF = 1e8;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,即最后一位为数字 0
int rnk[MAXN], height[MAXN];
// 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
void build_sa(int m) {
int i, *x = t, *y = t2;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = s[i]]++;
for(i = 1; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for(int k = 1; k <= n; k <<= 1) {
int p = 0;
for(i = n - k; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 0; i < m; i++) c[i] += c[i - 1];
for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
if(p >= n) break;
m = p;
}
}
void getHeight() {
int i, j, k = 0;
for(i = 0; i < n; i++) rnk[sa[i]] = i;
for(i = 0; i < n - 1; i++) {
if(k) k--;
j = sa[rnk[i] - 1];
while(s[i + k] == s[j + k]) k++;
height[rnk[i]] = k;
}
}
int T, kase = 1;
char s2[MAXN];
int q[MAXN];
int dp[MAXN][30];
void init() {
for(int i = 0; i < n; i++) {
dp[i][0] = height[i];
}
for(int i = 1; (1 << i) < MAXN; i++) {
for(int j = 0; j < n; j++) {
dp[j][i] = min(dp[j][i - 1], dp[j + (1 << (i - 1))][i - 1]);
}
}
}
int query(int l, int r) {
if(l > r) swap(l, r);
l++;
int k = (int)(log((double)r - l + 1) / log(2.0));
return min(dp[l][k], dp[r - (1 << k) + 1][k]);
}
int main() {
scanf("%d", &T);
while(T--) {
int m;
scanf("%d", &m);
scanf("%s", s);
int L = strlen(s);
int k = L;
s[L++] = '$';
for(int i = 1; i < m; i++) {
scanf("%s", s2);
int l = strlen(s2);
for(int j = L; j < L + l; j++) {
s[j] = s2[j - L];
}
L += l;
s[L++] = '$';
}
s[L] = 0;
n = L + 1;
build_sa(128);
getHeight();
init();
int p = -1, len = 0, cnt = 0, pre = -1;
if(sa[1] < k) q[cnt++] = sa[1];
else pre = sa[1];
for(int i = 2; i < n; i++) {
while(i < n && sa[i] < k) {
q[cnt++] = sa[i];
i++;
}
if(i == n) break;
for(int j = 0; j < cnt; j++) {
int tmp1;
if((tmp1 = query(rnk[q[j]], rnk[sa[i]])) + q[j] < k) {
int tmp2;
if(pre != -1 && (tmp2 = query(rnk[q[j]], rnk[pre])) + q[j] < k) {
int tlen = max(tmp1, tmp2) + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
if(pre == -1) {
int tlen = tmp1 + 1;
if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[j];
len = tlen;
}
}
}
}
cnt = 0;
if(sa[i] >= k) pre = sa[i];
}
for(int i = 0; i < cnt; i++) {
int tmp1;
if(pre != -1 && (tmp1 = query(rnk[q[i]], rnk[pre])) + q[i] < k) {
int tlen = tmp1 + 1;
if((q[i] + tlen <= k) && (p == -1 || tlen < len)) {
p = q[i];
len = tlen;
}
}
}
printf("Case #%d: ", kase++);
if(p == -1) puts("Impossible");
else {
for(int i = p; i < p + len; i++) printf("%c", s[i]);
printf("\n");
}
}
return 0;
}
Gym - 101194F(后缀数组)的更多相关文章
- Gym - 102028H Can You Solve the Harder Problem? (后缀数组+RMQ+单调栈)
题意:求一个序列中本质不同的连续子序列的最大值之和. 由于要求“本质不同”,所以后缀数组就派上用场了,可以从小到大枚举每个后缀,对于每个sa[i],从sa[i]+ht[i]开始枚举(ht[0]=0), ...
- 回文树&后缀自动机&后缀数组
KMP,扩展KMP和Manacher就不写了,感觉没多大意思. 之前感觉后缀自动机简直可以解决一切,所以不怎么写后缀数组. 马拉车主要是通过对称中心解决问题,有的时候要通过回文串的边界解决问题 ...
- 2018 - 2019 CTU Open Contest E. Locker Room 【后缀数组】
任意门:http://codeforces.com/gym/101954/problem/E E. Locker Room time limit per test 2.0 s memory limit ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- jeakins忘记密码时的处理(简单粗暴)
1.打开config文件(通过ps -elf | grep jenkins查看JENKINS_HOME目录,然后在目录下查找config.xml文件) 2.修改<useSecurity>t ...
- Python面试题之一:解密
Python面试题之一: 说明:就是Python工程师面试题 一.字典转换与正则提取值 1:key与Value交换 a = {'a':1,'b':2} print({value:key for key ...
- python 读取数据库中文内容显示一堆问号
需要在连接数据库时 设置编码格式 def select_db(self,db_name): self.conn = MySQLdb.connect( host = self.ip, port = se ...
- Metadata 的概念
https://www.ibm.com/developerworks/cn/cloud/library/1509_liukg_openstackmeta/ http://mathslinux.org/ ...
- html span和div的区别
div与span区别及用法 div与span区别及用法 DIV与SPAN区别及div与san用法篇 接下来了解在div+css开发的时候在html网页制作,特别是标签运用中div和span的区别及用法 ...
- poj 1840 枚举
Eqs Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 13967 Accepted: 6858 Description ...
- BI商业智能培训系列——(一)概述
简介: Business Intelligence,简称 BI. 商业智能,是指用现代的技术进行数据分析,以实现商业价值,这些技术包括数据仓库技术,线上分析处理技术,数据挖掘,数据展现技术等. 以往的 ...
- 【bzoj2879】[Noi2012]美食节 费用流+动态加边
原文地址:http://www.cnblogs.com/GXZlegend 题目描述 CZ市为了欢迎全国各地的同学,特地举办了一场盛大的美食节.作为一个喜欢尝鲜的美食客,小M自然不愿意错过这场盛宴.他 ...
- hdu 2579 Dating with girls(2) (bfs)
Dating with girls(2) Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Oth ...
- Google C++编程风格指南 - 中文版
Google C++编程风格指南 - 中文版 from http://code.google.com/p/google-styleguide/ 版本: 3.133原作者: Benjy Weinberg ...