题意:求出字符串中包含了某个字符的字符序列不一样的数量。

思路:其实主要的是找出每个被包含字符的数量,假设除了目标字符之外的所有字符都不一样,那么应该就很好求了,但是显然不可能,所以我们可以枚举每一个起点,个数应该是从他的下一个字符是目标字符起的所有数量,但是通过观察我们可以发现这样计算我们又会多计算了一部分,例如a , abbabbabb 在计算第四个和第七个时,我们会多计算了a, ab, abb 或者计算第二位和第五位时多计算了bba,bbab,bbabb,我们可以这是就是相当于后缀数组里面的height数组。

#include<bits/stdc++.h>
using namespace std; typedef long long ll;
const int MAXN = ;
bool cmp(int *r, int a, int b, int l) {
return r[a] == r[b] && r[a + l] == r[b + l];
}
int t1[MAXN], t2[MAXN], c[MAXN]; void da(int str[], int sa[], int rk[], int height[], int n, int m) {
n++;
int i, j, p, *x = t1, *y = t2;
//第一轮基数排序,如果 s 的最大值很大,可改为快速排序
for(i = ; i < m; i++)
c[i] = ;
for(i = ; i < n; i++)
c[x[i] = str[i]]++;
for(i = ; i < m; i++)
c[i] += c[i - ];
for(i = n - ; i >= ; i -- )
sa[ -- c[x[i]]] = i;
for(j = ; j <= n; j <<= ) {
p = ;
//直接利用 sa 数组排序第二关键字
for(i = n - j; i < n; i++)
y[p++] = i;//后面的 j 个数第二关键字为空的最小
for(i = ; i < n; i++)
if(sa[i] >= j)
y[p++] = sa[i] - j;
//这样数组 y 保存的就是按照第二关键字排序的结果
//基数排序第一关键字
for(i = ; i < m; i++)
c[i] = ;
for(i = ; i < n; i++)
c[x[y[i]]]++;
for(i = ; i < m; i++)
c[i] += c[i - ];
for(i = n - ; i >= ; i -- )
sa[ -- c[x[y[i]]]] = y[i];
//根据 sa 和 x 数组计算新的 x 数组
swap(x, y);
p = ;
x[sa[]] = ;
for(i = ; i < n; i++)
x[sa[i]] = cmp(y, sa[i - ], sa[i], j) ? p - : p++;
if(p >= n)
break;
m = p;//下次基数排序的最大值
}
int k = ;
n -- ;
for(i = ; i <= n; i++)
rk[sa[i]] = i;
for(i = ; i < n; i++) {
if(k) k -- ;
j = sa[rk[i] - ];
while(str[i + k] == str[j + k])
k++;
height[rk[i]] = k;
}
}
int rk[MAXN], height[MAXN], sa[MAXN], in[MAXN];
char s[MAXN], t[MAXN];
vector<int>vec;
vector<int>:: iterator it; int main() {
int T;scanf("%d", &T);
for(int ncase = ; ncase <= T; ncase ++){
scanf("%s%s",t, s);
int n = strlen(s);
vec.clear();
for(int i = ; i < n; i ++){
in[i] = s[i];
if(s[i] == t[]) vec.push_back(i);
}in[n] = ;
da(in, sa, rk, height, n, );
ll ans = ;
for(int i = ; i <= n; i ++){
it = lower_bound(vec.begin(), vec.end(), sa[i]);
printf("%d %d %d\n", sa[i], *it, height[i]);
if(it == vec.end()) continue;
int tmp = n - sa[i] - max(height[i], *it - sa[i]);
if(tmp > ) ans += tmp;
printf("Case #%d: %lld\n",ncase, ans);
}printf("\n");
}
return ;
}

Substring (后缀数组 + 计数)的更多相关文章

  1. POJ3693 Maximum repetition substring [后缀数组 ST表]

    Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9458   Acc ...

  2. HDU 5769 Substring 后缀数组

    Substring Problem Description ?? is practicing his program skill, and now he is given a string, he h ...

  3. hdu_1403_Longest Common Substring(后缀数组的应用)

    题目链接:hdu_1403_Longest Common Substring 题意: 给你两个字符串,然你找最长的公共子串 题解: 后缀数组的经典应用,要找两个字符串的公共子串,那么就相当于找两个串的 ...

  4. POJ3693 Maximum repetition substring 后缀数组

    POJ - 3693 Maximum repetition substring 题意 输入一个串,求重复次数最多的连续重复字串,如果有次数相同的,则输出字典序最小的 Sample input ccab ...

  5. 2016多校联合训练4 F - Substring 后缀数组

    Description ?? is practicing his program skill, and now he is given a string, he has to calculate th ...

  6. hdu 5769 Substring 后缀数组 + KMP

    http://acm.hdu.edu.cn/showproblem.php?pid=5769 题意:在S串中找出X串出现的不同子串的数目? 其中1 <= |S| < $10^5$ 官方题解 ...

  7. HDU 5679 Substring 后缀数组判重

    题意:求母串中有多少不同的包含x字符的子串 分析:(首先奉上FZU官方题解) 上面那个题就是SPOJ694 ,其实这两个题一样,原理每次从小到大扫后缀sa数组,加上新的当前后缀的若干前缀,再减去重复的 ...

  8. hdu 1403 Longest Common Substring 后缀数组 模板题

    题目链接 题意 问两个字符串的最长公共子串. 思路 加一个特殊字符然后拼接起来,求得后缀数组与\(height\)数组.扫描一遍即得答案,注意判断起始点是否分别在两个串内. Code #include ...

  9. POJ 3693 Maximum repetition substring ——后缀数组

    重复次数最多的字串,我们可以枚举循环节的长度. 然后正反两次LCP,然后发现如果长度%L有剩余的情况时,答案是在一个区间内的. 所以需要找到区间内最小的rk值. 两个后缀数组,四个ST表,$\Thet ...

随机推荐

  1. ubuntu安装thrift

    ubuntu环境下安装thrift-0.10.0 1.解压 2.编译安装 ./configure -with-cpp -with-boost -without-python -without-csha ...

  2. 网络编程 -- RPC实现原理 -- 目录

    -- 啦啦啦 -- 网络编程 -- RPC实现原理 -- NIO单线程 网络编程 -- RPC实现原理 -- NIO多线程 -- 迭代版本V1 网络编程 -- RPC实现原理 -- NIO多线程 -- ...

  3. Linux usb子系统(二) _usb-skeleton.c精析

    "./drivers/usb/usb-skeleton.c"是内核提供给usb设备驱动开发者的海量存储usb设备的模板程序, 程序不长, 通用性却很强,十分经典, 深入理解这个文件 ...

  4. oracle多个单引号的处理

    Oracle多个单引号的处理 在ORACLE中,单引号有两个作用,一是字符串是由单引号引用,二是转义.单引号的使用是就近配对,即就近原则.而在单引号充当转义角色时相对不好理解. 下面转载 1.从第二个 ...

  5. Psi Probe 安装及使用说明

    这是一款 Tomcat 管理和监控工具,前身是 Lambda Probe.由于 Lambda Probe 2006不再更新,所以 PSI Probe 算是对其的一个 Fork 版本并一直更新至今. g ...

  6. 关于4A网络安全管控平台控件加载失败的解决方法

    最近电脑重装系统后,到公司登录4A管控平台提示"控件加载失败","无效的参数为:Null","点击资源无任何反映"等等问题 别人的电脑用的好 ...

  7. 关于“.bash_profile”和“.bashrc”区别的总结

    bash的startup文件 Linux shell是用户与Linux系统进行交互的媒介,而bash作为目前Linux系统中最常用的shell,它支持的startup文件也并不单一,甚至容易让人感到费 ...

  8. poj3335

    半平面交&多边形内核.因为没注意了点的情况自闭了. https://blog.csdn.net/qq_40861916/article/details/83541403 这个说的贼好. 多边形 ...

  9. python 链表表达式 map、filter易读版

    链表推导式 [x for x in x] 链表推导式提供了一个创建链表的简单途径,无需使用 map(), filter() 以及 lambda.返回链表的定义通常要比创建这些链表更清晰.每一个链表推导 ...

  10. jquery parents() next() prev() 找父级别标签 找同级别标签

    html结构 解决方法: jquery parents()  找父级别标签 next() 同级别向下找 prev() 同级别想上找 我这里找的是一个,下面有n个的方法 $(document).read ...