Description

很久很久以前,森林里住着一群跳蚤。一天,跳蚤国王得到了一个神秘的字符串,它想进行研究。首先,他会把串

分成不超过 k 个子串,然后对于每个子串 S,他会从S的所有子串中选择字典序最大的那一个,并在选出来的k个子串中选择字典序最大的那一个。他称其为“魔力串”。现在他想找一个最优的分法让“魔力串”字典序最小。

Input

第一行一个整数 k,K<=15

接下来一个长度不超过 10^5 的字符串 S。

Output

输出一行,表示字典序最小的“魔力串”。

Sample Input

2

ababa

Sample Output

ba

//解释:

分成aba和ba两个串,其中字典序最大的子串为ba


思路

首先我们要让所有段的最大子串的最大串最小,然后就可以考虑用二分,因为有一大堆子串的操作

不难想到后缀数组

然后就可以考虑怎么check

我们从后向前贪心

每次因为只需要向前扩展一个位置,所以每次只用检查一个子串是不是大于当前二分出的串

然后就可以很方便地做出来了


height处理的时候老是要写错

然后求lcp的时候注意把左区间的指针右移,并且要特判两个串的起始位置相等的情况

然后是贪心的时候每一段最后一个字符一定要特判


#include<bits/stdc++.h>

using namespace std;

typedef pair<int, int> pi;
typedef long long ll;
const int N = 1e5 + 10;
const int LOG = 20; struct Suffix_Array {
int s[N], n, m;
int c[N], x[N], y[N];
int height[N], sa[N], rank[N];
int st[N][LOG], Log[N];
ll rank_pre[N]; void init(int len, char *c) {
n = len, m = 0;
for (int i = 1; i <= len; i++) {
s[i] = c[i];
m = max(m, s[i]);
}
} void radix_sort() {
for (int i = 1; i <= m; i++) c[i] = 0;
for (int i = 1; i <= n; i++) c[x[y[i]]]++;
for (int i = 1; i <= m; i++) c[i] += c[i - 1];
for (int i = n; i >= 1; i--) sa[c[x[y[i]]]--] = y[i];
} void buildsa() {
for (int i = 1; i <= n; i++) x[i] = s[i], y[i] = i;
radix_sort();
int now;
for (int k = 1; k <= n; k <<= 1) {
now = 0;
for (int i = n - k + 1; i <= n; i++) y[++now] = i;
for (int i = 1; i <= n; i++) if (sa[i] > k) y[++now] = sa[i] - k;
radix_sort();
y[sa[1]] = now = 1;
for (int i = 2; i <= n; i++) y[sa[i]] = (x[sa[i]] == x[sa[i - 1]] && x[sa[i] + k] == x[sa[i - 1] + k]) ? now : ++now;
swap(x, y);
if (now == n) break;
m = now;
}
} void buildrank() {
for (int i = 1; i <= n; i++) rank[sa[i]] = i;
} void buildrank_pre() {
for (int i = 1; i <= n; i++) rank_pre[i] = rank_pre[i - 1] + n - sa[i] + 1 - height[i];
} void buildheight() {
for (int i = 1; i <= n; i++) if (rank[i] != 1) {
int k = max(height[rank[i - 1]] - 1, 0); // 里面是 rank[i - 1]
for (; s[i + k] == s[sa[rank[i] - 1] + k]; k++);
height[rank[i]] = k; // height 里面是 rank
}
} void buildst() {
Log[1] = 0;
for (int i = 2; i < N; i++) Log[i] = Log[i >> 1] + 1;
for (int i = 1; i <= n; i++) st[i][0] = height[i];
for (int j = 1; j < LOG; j++) {
for (int i = 1; i + (1 << (j - 1)) <= n; i++) {
st[i][j] = min(st[i][j - 1], st[i + (1 << (j - 1))][j - 1]);
}
}
} int queryst(int l, int r) {
if (l > r) swap(l, r);
++l; //***
int k = Log[r - l + 1];
return min(st[l][k], st[r - (1 << k) + 1][k]);
} int querylcp(int la, int ra, int lb, int rb) {
if (rank[la] == rank[lb]) return min(ra - la + 1, rb - lb + 1);
return min(min(ra - la + 1, rb - lb + 1), queryst(rank[la], rank[lb]));
} //return substringa <= substringb
bool cmpsubstring(int la, int ra, int lb, int rb) {
int lcp = querylcp(la, ra, lb, rb);
if (ra - la + 1 == lcp) return 1;
if (rb - lb + 1 == lcp) return 0;
return s[la + lcp] < s[lb + lcp];
} pi findkth(ll k) {
int pos = lower_bound(rank_pre + 1, rank_pre + n + 1, k) - rank_pre;
return pi(sa[pos], sa[pos] + height[pos] + k - rank_pre[pos - 1] - 1);
}
} Sa; int k, len;
char c[N]; bool check(pi cur) {
int last = len, tot = 0;
for (int i = len; i >= 1; i--) {
if (!Sa.cmpsubstring(i, last, cur.first, cur.second)) {
if (++tot > k) return 0;
last = i;
if (!Sa.cmpsubstring(i, last, cur.first, cur.second)) return 0;
}
}
return ++tot <= k;
} int main() {
#ifdef dream_maker
freopen("input.txt", "r", stdin);
#endif
scanf("%d", &k);
scanf("%s", c + 1);
len = strlen(c + 1);
Sa.init(len, c);
Sa.buildsa();
Sa.buildrank();
Sa.buildheight();
Sa.buildrank_pre();
Sa.buildst();
ll l = 1, r = Sa.rank_pre[len];
pi ans(1, 1);
while (l <= r) {
ll mid = (l + r) >> 1;
pi cur = Sa.findkth(mid);
if (check(cur)) {
ans = cur, r = mid - 1;
} else l = mid + 1;
}
for (int i = ans.first; i <= ans.second; i++) putchar(c[i]);
return 0;
}

BZOJ4310: 跳蚤 【后缀数组+二分】的更多相关文章

  1. [BZOJ4310] 跳蚤 - 后缀数组,二分,ST表

    [BZOJ4310] 跳蚤 Description 首先,他会把串分成不超过 \(k\) 个子串,然后对于每个子串 \(S\) ,他会从 \(S\) 的所有子串中选择字典序最大的那一个,并在选出来的 ...

  2. 【bzoj4310】跳蚤 后缀数组+二分

    题目描述 很久很久以前,森林里住着一群跳蚤.一天,跳蚤国王得到了一个神秘的字符串,它想进行研究. 首先,他会把串分成不超过 k 个子串,然后对于每个子串 S,他会从S的所有子串中选择字典序最大的那一个 ...

  3. bzoj 4310 跳蚤 —— 后缀数组+二分答案+贪心

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4310 二分答案——在本质不同的子串中二分答案! 如果二分到的子串位置是 st,考虑何时必须分 ...

  4. bzoj 4310 跳蚤——后缀数组+二分答案+贪心

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4310 答案有单调性? 二分出来一个子串,判断的时候需要满足那些字典序比它大的子串都不出现! ...

  5. BZOJ 3230: 相似子串( RMQ + 后缀数组 + 二分 )

    二分查找求出k大串, 然后正反做后缀数组, RMQ求LCP, 时间复杂度O(NlogN+logN) -------------------------------------------------- ...

  6. BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案

    BZOJ_2946_[Poi2000]公共串_后缀数组+二分答案 Description          给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单 ...

  7. BZOJ 1717 [USACO06DEC] Milk Patterns (后缀数组+二分)

    题目大意:求可重叠的相同子串数量至少是K的子串最长长度 洛谷传送门 依然是后缀数组+二分,先用后缀数组处理出height 每次二分出一个长度x,然后去验证,在排序的后缀串集合里,有没有连续数量多于K个 ...

  8. POJ 1743 [USACO5.1] Musical Theme (后缀数组+二分)

    洛谷P2743传送门 题目大意:给你一个序列,求其中最长的一对相似等长子串 一对合法的相似子串被定义为: 1.任意一个子串长度都大于等于5 2.不能有重叠部分 3.其中一个子串可以在全部+/-某个值后 ...

  9. Poj 1743 Musical Theme(后缀数组+二分答案)

    Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...

  10. Poj 3261 Milk Patterns(后缀数组+二分答案)

    Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...

随机推荐

  1. C语言专题-基本数据类和占位符

    C语言中常用的几种基本数据类型有 基本数据类型的长度 unsigned unsigned unsigned unsigned float没有unsigned double没有unsigned 占位符的 ...

  2. Python - configParser模块学习

    configParser 模块用于操作配置文件 注:Parser汉译为“解析”之意. 配置文件的格式与windows ini文件类似,可以包含一个或多个节(section),每个节可以有多个参数(键= ...

  3. 雷林鹏分享:C# 特性(Attribute)

    C# 特性(Attribute) 特性(Attribute)是用于在运行时传递程序中各种元素(比如类.方法.结构.枚举.组件等)的行为信息的声明性标签.您可以通过使用特性向程序添加声明性信息.一个声明 ...

  4. Java 访问控制关键字

    public, private, protected 在控制上有什么区别和不同请参考下面的说明. 请参考下图的说明. 和下面的一个说明: │ Class │ Package │ Subclass │ ...

  5. Windows 环境下安装 Oracle JDK

    本页面中描述了如何在 Window 环境下安装 Oracle JDK. 我们使用的版本是 Window 10,我们需要安装的版本是 Oracle JDK 8u191. 检查当前版本 在进行新的 JDK ...

  6. MySQL缓存机制

    对MySql查询缓存及SQL Server过程缓存的理解及总结 一.MySql的Query Cache 1.Query Cache   MySQL Query Cache是用来缓存我们所执行的SELE ...

  7. SourceTree

    MAC上最好的GIT免费GUI工具是SourceTree(没有之一).此外,最好的GIT代码开源网站是GitHub,最好的GIT代码私有库是BitBucket https://www.sourcetr ...

  8. 24.2 网络编程基础——System.Net 命名空间

    使用C#进行网络编程时,通常要用到: System. Net  命名空间. System. Net. Sockets  命名空间. System. Net. Mail  命名空间. 24.2.1 Sy ...

  9. oracle12c新特点之可插拔数据库(Pluggable Database,PDB)

    1.    12c PDB新特点的优势 1)    可以把多个PDB集成进一个平台. 2)    可以快速提供一个新的PDB或一个已有PDB的克隆. 3)    通过拔插技术,可以快速把存在的数据库重 ...

  10. javascript primise本质——为了简化异步编码而针对异步操作的代理

    概述 所谓Promise,简单说就是一个容器,里面保存着某个未来才会结束的事件(通常是一个异步操作)的结果. 语法 new Promise(executor); new Promise(functio ...