【poj3415】 Common Substrings

题意

　　给定两个字符串 A 和 B，求长度不小于 k 的公共子串的个数（可以相同）。

Solution

　　后缀数组论文题。。。

　　基本思路是计算 A 的所有后缀和 B 的所有后缀之间的最长公共前缀的长度，把最长公共前缀长度不小于 k 的部分全部加起来。先将两个字符串连起来，中间用一个没有出现过的字符隔开。按 height 值分组后，接下来的工作便是快速的统计每组中后缀之间的最长公共前缀之和。扫描一遍，每遇到一个 B 的后缀就统计与前面的 A 的后缀能产生多少个长度不小于 k 的公共子串，这里 A 的后缀需要用一个单调的栈来高效的维护。然后对 A 也这样做一次。

　　如何用单调栈来维护呢？这真的是一个问题。这里我运用的单调栈与一般的单调栈不一样。单调栈里面记录一个结构体，结构体记录每个串对答案的贡献w以及这种串的个数c，自栈底向栈顶w递增。每次扫描到一个height[i]当它小于栈顶时，将栈顶的元素与栈顶第二个元素合并，并且更新栈中元素的总贡献。

细节

　　数组开两倍。

代码

// poj3693

#include<algorithm>

#include<iostream>

#include<cstdlib>

#include<cstring>

#include<cstdio>

#include<cmath>

#include<queue>

#define LL long long

#define inf 1<<30

#define Pi acos(-1.0)

#define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);

using namespace std;

const int maxn=500010;

int sa[maxn],rank[maxn],height[maxn];

int n,K;

char s[maxn];

struct data {int w,c;}st[maxn];

namespace Suffix {

	int wa[maxn],wb[maxn],ww[maxn];

	bool cmp(int *r,int a,int b,int l) {

		return r[a]==r[b] && r[a+l]==r[b+l];

	}

	void da(char *r,int *sa,int n,int m) {

		int i,j,p,*x=wa,*y=wb;

		for (i=0;i<=m;i++) ww[i]=0;

		for (i=1;i<=n;i++) ww[x[i]=r[i]]++;

		for (i=1;i<=m;i++) ww[i]+=ww[i-1];

		for (i=n;i>=1;i--) sa[ww[x[i]]--]=i;

		for (p=0,j=1;p<n;j*=2,m=p) {

			for (p=0,i=n-j+1;i<=n;i++) y[++p]=i;

			for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j;

			for (i=0;i<=m;i++) ww[i]=0;

			for (i=1;i<=n;i++) ww[x[y[i]]]++;

			for (i=1;i<=m;i++) ww[i]+=ww[i-1];

			for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i];

			for (swap(x,y),p=x[sa[1]]=1,i=2;i<=n;i++)

				x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p;

		}

	}

	void calheight(char *r,int *sa,int n) {

		for (int i=1;i<=n;i++) rank[sa[i]]=i;

		for (int k=0,i=1;i<=n;i++) {

			if (k) k--;

			int j=sa[rank[i]-1];

			while (r[i+k]==r[j+k]) k++;

			height[rank[i]]=k;

		}

	}

}

int main() {

	while (scanf("%d",&K)!=EOF && K) {

		scanf("%s",s+1);

		int n=strlen(s+1);

		s[++n]='#';

		int l=n;

		scanf("%s",s+n+1);

		n=strlen(s+1);

		Suffix::da(s,sa,n,300);

		Suffix::calheight(s,sa,n);

		int top=0;LL ans=0,S=0;

		height[n+1]=inf;

		for (int i=1;i<=n+1;i++) {

			if (sa[i]>l && i!=n+1) ans+=S;

			if (height[i+1]>=K) {

				while (top>1 && st[top-1].w>height[i+1]-K+1) {

					st[top-1].c+=st[top].c;

					S-=(st[top].w-st[top-1].w)*st[top].c;

					st[top--]=(data){0,0};

				}

				if (st[top].w>height[i+1]-K+1) {

					if (st[top-1].w==height[i+1]-K+1) {

						st[top-1].c+=st[top].c;

						S-=(st[top].w-st[top-1].w)*st[top].c;

						st[top--]=(data){0,0};

					}

					else {S-=(st[top].w-(height[i+1]-K+1))*st[top].c;st[top].w=height[i+1]-K+1;}

				}

				if (sa[i]<l) {

					if (st[top].w==height[i+1]-K+1) st[top].c++;

					else st[++top]=(data){height[i+1]-K+1,1};

					S+=height[i+1]-K+1;

				}

			}

			else {while (top) st[top--]=(data){0,0};S=0;}

		}

		for (int i=1;i<=n+1;i++) {

			if (sa[i]<l && i!=n+1) ans+=S;

			if (height[i+1]>=K) {

				while (top>1 && st[top-1].w>height[i+1]-K+1) {

					st[top-1].c+=st[top].c;

					S-=(st[top].w-st[top-1].w)*st[top].c;

					st[top--]=(data){0,0};

				}

				if (st[top].w>height[i+1]-K+1) {

					if (st[top-1].w==height[i+1]-K+1) {

						st[top-1].c+=st[top].c;

						S-=(st[top].w-st[top-1].w)*st[top].c;

						st[top--]=(data){0,0};

					}

					else {S-=(st[top].w-(height[i+1]-K+1))*st[top].c;st[top].w=height[i+1]-K+1;}

				}

				if (sa[i]>l) {

					if (st[top].w==height[i+1]-K+1) st[top].c++;

					else st[++top]=(data){height[i+1]-K+1,1};

					S+=height[i+1]-K+1;

				}

			}

			else {while (top) st[top--]=(data){0,0};S=0;}

		}

		printf("%lld\n",ans);

	}

    return 0;

}

【poj3415】 Common Substrings的更多相关文章

【POJ3415】 Common Substrings（后缀数组|SAM）
Common Substrings Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤ ...
【POJ3415】Common Substrings（后缀数组，单调栈）
题意: n<=1e5 思路: 我的做法和题解有些不同题解是维护A的单调栈算B的贡献,反过来再做一次我是去掉起始位置不同这个限制条件先算总方案数,再把两个串内部不合法的方案数减去式子展开之后 ...
【POJ3415】 Common Substrings (SA+单调栈)
这道是求长度不小于 k 的公共子串的个数...很不幸,我又TLE了... 解法参考论文以及下面的链接 http://www.cnblogs.com/vongang/archive/2012/11/20 ...
【SPOJ】Distinct Substrings（后缀自动机）
[SPOJ]Distinct Substrings(后缀自动机) 题面 Vjudge 题意:求一个串的不同子串的数量题解对于这个串构建后缀自动机之后我们知道每个串出现的次数就是\(right/e ...
【SPOJ】Distinct Substrings/New Distinct Substrings（后缀数组）
[SPOJ]Distinct Substrings/New Distinct Substrings(后缀数组) 题面 Vjudge1 Vjudge2 题解要求的是串的不同的子串个数两道一模一样的题 ...
【CF316G3】Good Substrings 后缀自动机
[CF316G3]Good Substrings 题意:给出n个限制(p,l,r),我们称一个字符串满足一个限制当且仅当这个字符串在p中的出现次数在[l,r]之间.现在想问你S的所有本质不同的子串中, ...
【Aizu2292】Common Palindromes（回文树）
[Aizu2292]Common Palindromes(回文树) 题面 Vjudge 神TMD日语翻译: 给定两个字符串\(S,T\),询问\((i,j,k,l)\)这样的四元组个数满足\(S[ ...
【SPOJ】Distinct Substrings
[SPOJ]Distinct Substrings 求不同子串数量统计每个点有效的字符串数量(第一次出现的) \(\sum\limits_{now=1}^{nod}now.longest-paren ...
【POJ 3415】Common Substrings
[链接]h在这里写链接 [题意] 求两个串的长度大于等于k的公共子串个数. 相同的重复计数. [题解] 先把两个字符串用一个分隔符分开.最好比出现的字符都大的一个数字. ...

随机推荐

20155234 《网络对抗》Exp 8 Web基础
基础问答什么是表单可以收集用户的信息和反馈意见,是网站管理者与浏览者之间沟通的桥梁. 表单包括两个部分:一部分是HTML源代码用于描述表单(例如,域,标签和用户在页面上看见的按钮),另一部分是脚本 ...
python 回溯法子集树模板系列 —— 9、旅行商问题（TSP）
问题旅行商问题(Traveling Salesman Problem,TSP)是旅行商要到若干个城市旅行,各城市之间的费用是已知的,为了节省费用,旅行商决定从所在城市出发,到每个城市旅行一次后返回初 ...
分享一下个人学PS的过程
得知Photoshop这款软件是在上大学的时候,2010年.学校学生会的科技部纳新,要求新人会PPT.word.Excel和Photoshop.当时有一个Photoshop大神,成为了学生会科技部的主 ...
xgboost学习与总结
最近在研究xgboost,把一些xgboost的知识总结一下.这里只是把相关资源作总结,原创的东西不多. 原理 xgboost的原理首先看xgboost的作者陈天奇的ppt 英文不太好的同学可以看看这 ...
R绘图第十篇：绘制文本、注释和主题（ggplot2）
使用ggplot2包绘制时,为了更直观地向用户显示报表的内容和外观,需要使用geom_text()函数添加文本说明,使用annotate()添加注释,并通过theme()来调整非数据的外观. 一,文本 ...
记录Jenkins+gitlab+maven
摘要昨天抽空将jenkins+gitlab(git)+maven整合了一下,再次记录一下以防下次再去查找省的麻烦. git.maven.java配置启动jenkins之后进入系统管理里面的Glob ...
贪心算法HURUST题目
题目描述: Yogurt factory The cows have purchased a yogurt factory that makes world-famous Yucky Yogurt. ...
pip virtualenv requirement
原文:https://blog.csdn.net/u011860731/article/details/46561513 pip可以很方便的安装.卸载和管理Python的包.virtualenv则可以 ...
金蝶盘点机PDA仓库条码管理家电类序列号扫描操作方法-采购入库单
1.1. 采购入库单传统的进销存管理软件需要人工识别商品品种,清点商品数量,然后再去人工手工在电脑上一行行的录入采购入库单.录单效率低,误差大. 如果使用汉码盘点机PDA,入库时,仓管员只需要手持 ...
kubeadm安装kubernetes 1.13.1集群完整部署记录
k8s是什么 Kubernetes简称为k8s,它是 Google 开源的容器集群管理系统.在 Docker 技术的基础上,为容器化的应用提供部署运行.资源调度.服务发现和动态伸缩等一系列完整功能,提 ...

【poj3415】 Common Substrings

题意

Solution

细节

代码

【poj3415】 Common Substrings的更多相关文章

随机推荐

热门专题