Description

给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?

Input

第一行两个整数n,k。

接下来n行每行一个字符串。

Output

一行n个整数,第i个整数表示第i个字符串的答案。

Sample Input

3 1

abc

a

ab

Sample Output

6 1 3

HINT

对于 100% 的数据,1<=n,k<=105,所有字符串总长不超过105,字符串只包含小写字母。


思路

首先发现这东西是真的不好做。。。那就找找性质

先把所有子串的贡献拆分成每个后缀的前缀的贡献

然后考虑怎么算每个后缀的贡献

又因为对于后缀i,假设前j个前缀有贡献,那么对于后缀i+1,它的前j-1个前缀一定是有贡献的

是不是就想到了height数组的处理,很容易证明这个的复杂度是线性的

那么怎么考虑可不可以扩展呢?

因为我们要算这个串的出现次数

并且知道连接所有串的分隔符一定是不会被匹配的

所以我们可以直接二分出包含这个串的排名区间

那么就可以预处理出排名第i的字符串至少要到第j个排名的字符串才能包含k个不同的字符串

这个东西可以双指针做


一定要把预处理的指针数组初值设成INF


 #include<bits/stdc++.h>

using namespace std;

typedef pair<int, int> pi;
typedef long long ll;
const int N = 2e5 + 10;
const int LOG = 20; struct Suffix_Array {
int s[N], n, m;
int c[N], x[N], y[N];
int height[N], sa[N], rank[N];
int st[N][LOG], Log[N];
ll sum[N]; void init(int len, char *c) {
n = len, m = 0;
for (int i = 1; i <= len; i++) {
s[i] = c[i];
m = max(m, s[i]);
}
} void radix_sort() {
for (int i = 1; i <= m; i++) c[i] = 0;
for (int i = 1; i <= n; i++) c[x[y[i]]]++;
for (int i = 1; i <= m; i++) c[i] += c[i - 1];
for (int i = n; i >= 1; i--) sa[c[x[y[i]]]--] = y[i];
} void buildsa() {
for (int i = 1; i <= n; i++) x[i] = s[i], y[i] = i;
radix_sort();
int now;
for (int k = 1; k <= n; k <<= 1) {
now = 0;
for (int i = n - k + 1; i <= n; i++) y[++now] = i;
for (int i = 1; i <= n; i++) if (sa[i] > k) y[++now] = sa[i] - k;
radix_sort();
y[sa[1]] = now = 1;
for (int i = 2; i <= n; i++) y[sa[i]] = (x[sa[i]] == x[sa[i - 1]] && x[sa[i] + k] == x[sa[i - 1] + k]) ? now : ++now;
swap(x, y);
if (now == n) break;
m = now;
}
} void buildrank() {
for (int i = 1; i <= n; i++) rank[sa[i]] = i;
} void buildsum() {
for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] + n - sa[i] + 1 - height[i];
} void buildheight() {
for (int i = 1; i <= n; i++) if (rank[i] != 1) {
int k = max(height[rank[i - 1]] - 1, 0);
for (; s[i + k] == s[sa[rank[i] - 1] + k]; k++);
height[rank[i]] = k;
}
} void buildst() {
Log[1] = 0;
for (int i = 2; i < N; i++) Log[i] = Log[i >> 1] + 1;
for (int i = 1; i <= n; i++) st[i][0] = height[i];
for (int j = 1; j < LOG; j++) {
for (int i = 1; i + (1 << (j - 1)) <= n; i++) {
st[i][j] = min(st[i][j - 1], st[i + (1 << (j - 1))][j - 1]);
}
}
} int queryst(int l, int r) {
if (l == r) return n - sa[l] + 1;
if (l > r) swap(l, r);
++l; //***
int k = Log[r - l + 1];
return min(st[l][k], st[r - (1 << k) + 1][k]);
} int querylcp(int la, int lb) {
return queryst(rank[la], rank[lb]);
} int querylcp(int la, int ra, int lb, int rb) {
return min(min(ra - la + 1, rb - lb + 1), queryst(rank[la], rank[lb]));
} void build(int len, char *c) {
init(len, c);
buildsa();
buildrank();
buildheight();
buildsum();
buildst();
}
} Sa; char s[N], c[N];
int len[N], bg[N], ed[N], tot = 0;
int n, k, rpos[N], num[N], bel[N]; bool check(int pos, int len) {
int x = Sa.rank[pos], l, r;
int l_line = x, r_line = x;
l = 1, r = x - 1;
while (l <= r) {
int mid = (l + r) >> 1;
if (Sa.queryst(x, mid) > len) l_line = mid, r = mid - 1;
else l = mid + 1;
}
l = x + 1, r = tot;
while (l <= r) {
int mid = (l + r) >> 1;
if (Sa.queryst(x, mid) > len) r_line = mid, l = mid + 1;
else r = mid - 1;
}
return rpos[l_line] <= r_line;
} int main() {
#ifdef dream_maker
freopen("input.txt", "r", stdin);
#endif
scanf("%d %d", &n, &k);
for (int i = 1; i <= n; i++) {
scanf("%s", c + 1);
len[i] = strlen(c + 1);
bg[i] = tot + 1;
for (int j = 1; j <= len[i]; j++) {
s[++tot] = c[j];
bel[tot] = i;
}
ed[i] = tot;
s[++tot] = '#';
}
Sa.build(tot, s);
memset(rpos, 0x3f, sizeof(rpos)); //*****
int l = 1, r = 0, cnt = 0;
for (; r <= tot; r++) {
if (!bel[Sa.sa[r]]) continue;
++num[bel[Sa.sa[r]]];
if (num[bel[Sa.sa[r]]] == 1) ++cnt;
if (cnt >= k) {
for (; l <= r; l++) {
if (!bel[Sa.sa[l]]) continue;
if (cnt >= k) rpos[l] = r;
else break;
if (num[bel[Sa.sa[l]]] == 1) --cnt;
--num[bel[Sa.sa[l]]];
}
}
}
for (int i = 1; i <= n; i++) {
ll ans = 0; int cur = 0;
for (int j = bg[i]; j <= ed[i]; j++) {
cur = max(cur - 1, 0);
while (j + cur <= ed[i] && check(j, cur)) ++cur;
ans += cur;
}
printf("%lld ", ans);
}
return 0;
}

BZOJ3473: 字符串【后缀数组+思维】的更多相关文章

  1. BZOJ3473:字符串(后缀数组,主席树,二分,ST表)

    Description 给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串? Input 第一行两个整数n,k. 接下来n行每行一个字符串. Output 一 ...

  2. Bzoj4556: [Tjoi2016&Heoi2016]字符串 后缀数组

    4556: [Tjoi2016&Heoi2016]字符串 Time Limit: 20 Sec  Memory Limit: 128 MBSubmit: 169  Solved: 87[Sub ...

  3. 【BZOJ 3473】 字符串 (后缀数组+RMQ+二分 | 广义SAM)

    3473: 字符串 Description 给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串? Input 第一行两个整数n,k. 接下来n行每行一个字符串 ...

  4. BZOJ 3277: 串/ BZOJ 3473: 字符串 ( 后缀数组 + RMQ + 二分 )

    CF原题(http://codeforces.com/blog/entry/4849, 204E), CF的解法是O(Nlog^2N)的..记某个字符串以第i位开头的字符串对答案的贡献f(i), 那么 ...

  5. 【BZOJ-4556】字符串 后缀数组+二分+主席树 / 后缀自动机+线段树合并+二分

    4556: [Tjoi2016&Heoi2016]字符串 Time Limit: 20 Sec  Memory Limit: 128 MBSubmit: 657  Solved: 274[Su ...

  6. [BZOJ4556][Tjoi2016&Heoi2016]字符串 后缀数组+主席树

    4556: [Tjoi2016&Heoi2016]字符串 Time Limit: 20 Sec  Memory Limit: 128 MB Description 佳媛姐姐过生日的时候,她的小 ...

  7. 【BZOJ4556】[Tjoi2016&Heoi2016]字符串 后缀数组+二分+主席树+RMQ

    [BZOJ4556][Tjoi2016&Heoi2016]字符串 Description 佳媛姐姐过生日的时候,她的小伙伴从某东上买了一个生日礼物.生日礼物放在一个神奇的箱子中.箱子外边写了一 ...

  8. bzoj4556: [Tjoi2016&Heoi2016]字符串 (后缀数组加主席树)

    题目是给出一个字符串,每次询问一个区间[a,b]中所有的子串和另一个区间[c,d]的lcp最大值,首先求出后缀数组,对于lcp的最大值肯定是rank[c]的前驱和后继,但是对于这个题会出现问题,就是题 ...

  9. 【BZOJ3277/3473】串/字符串 后缀数组+二分+RMQ+双指针

    [BZOJ3277]串 Description 字符串是oi界常考的问题.现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). Inpu ...

  10. [BZOJ3277/BZOJ3473] 串 - 后缀数组,二分,双指针,ST表,均摊分析

    [BZOJ3277] 串 Description 现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身). Solution 首先将所有串连 ...

随机推荐

  1. Mask R-CNN论文理解

    摘要: Mask RCNN可以看做是一个通用实例分割架构. Mask RCNN以Faster RCNN原型,增加了一个分支用于分割任务. Mask RCNN比Faster RCNN速度慢一些,达到了5 ...

  2. Java 密码扩展无限制权限策略文件[转]

    因为某些国家的进口管制限制,Java发布的运行环境包中的加解密有一定的限制.比如默认不允许256位密钥的AES加解密,解决方法就是修改策略文件. 官方网站提供了JCE无限制权限策略文件的下载: JDK ...

  3. Python - openpyxl 读写操作Excel

    openpyxl特点   openpyxl(可读写excel表)专门处理Excel2007及以上版本产生的xlsx文件,xls和xlsx之间转换容易 注意:如果文字编码是“gb2312” 读取后就会显 ...

  4. 理解Spring4.0新特性@RestController注解

    参考原文 @RestController注解是它继承自@Controller注解.4.0之前的版本,spring MVC的组件都使用@Controller来标识当前类是一个控制器servlet. 使用 ...

  5. SGE:qsub/qstat/qdel/qhost 任务投递和监控

    参考: Oracle Grid Engine qsub命令 SGE - qsub使用范例 SGE作业基本用法 qsub是最为稳定的底层任务投递系统,就是把一个脚本投递到集群的计算节点上运行. 注意,只 ...

  6. LeetCode--107--二叉树的层次遍历II

    问题描述: 给定一个二叉树,返回其节点值自底向上的层次遍历. (即按从叶子节点所在层到根节点所在的层,逐层从左向右遍历) 例如: 给定二叉树 [3,9,20,null,null,15,7], 3 / ...

  7. 20170706pptVBA演示文稿批量删除图片

    Public Sub StartRecursionFolder() Dim Pre As Presentation Dim FolderPath As String Dim pp As String ...

  8. bzoj1833: [ZJOI2010]count 数字计数 数位dp

    bzoj1833 Description 给定两个正整数a和b,求在[a,b]中的所有整数中,每个数码(digit)各出现了多少次. Input 输入文件中仅包含一行两个整数a.b,含义如上所述. O ...

  9. node搭建本地服务器

    随着前端不断发展,node基本已经成为必备,在调试的时候经常需要服务器,在之前的做法通常是去下载一个phpstudy 或者 xampp等启动一个服务,作为一个前端人虽然可以借助各种工具,但是怎么能不懂 ...

  10. UVA-1322 Minimizing Maximizer (DP+线段树优化)

    题目大意:给一个长度为n的区间,m条线段序列,找出这个序列的一个最短子序列,使得区间完全被覆盖. 题目分析:这道题不难想,定义状态dp(i)表示用前 i 条线段覆盖区间1~第 i 线段的右端点需要的最 ...