poj - 2774 - Long Long Message
题意:输入2个长度不超过100000的字符串,问它们最长公共子串的长度。
题目链接:http://poj.org/problem?id=2774
——>>后缀数组!后缀数组!
~从LJ的《训练指南》,到许智磊的论文+PPT,吉大的模版,学长的博客,这路还真不容易走。。。
最后决定用LJ《训练指南》的写法,感觉挺精辟的。
合并两个串,中间放一个特殊字符,根据条件(len为第一个串的长度,n为合并后串的长度):
(sa[i] >= 0 && sa[i] < len && sa[i-1] > len && sa[i-1] < n) || (sa[i-1] >= 0 && sa[i-1] < len && sa[i] > len && sa[i] < n)判断是否取height[i],取出最大值。
#include <cstdio>
#include <cstring>
#include <algorithm> using namespace std; const int maxn = 100000 * 2 + 10; char s[maxn], s2[maxn];
int sa[maxn], t1[maxn], t2[maxn], c[maxn], rak[maxn], height[maxn], n; void build_sa(int m){
int i, *x = t1, *y = t2;
//基数排序
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[i] = s[i]]++;
for(i = 1; i < m; i++) c[i] += c[i-1]; //预留空位给比c[i]小的字符
for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i; //从右往左,相等的从大号到小号 for(int k = 1; k < n; k <<= 1){ //每次判断时已算完了长度为k的后缀
int p = 0;
//直接用sa数组排序第二关键字
for(i = n-k; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k; //刚才是sa[i]位,倍增后左移变位于sa[i]-k位
//第二关键字排完序后已连成一条链,从端开始扫描就是
//基数排序第一关键字
for(i = 0; i < m; i++) c[i] = 0;
for(i = 0; i < n; i++) c[x[y[i]]]++;
for(i = 1; i < m; i++) c[i] += c[i-1];
for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i]; //从右往左扫描y[i]是第二关键字从大到小,它应放到第一关键字相同的最右
//根据sa和y数组计算新的x数组
swap(x, y); //此时y数组变得没意义,但更新x数组又要用到原来的x数组,所以将原来的x数组存到y数组里
p = 1;
x[sa[0]] = 0; //(以下类似于离散化)最小的那1位赋0,接着开始从小到大扫描
for(i = 1; i < n; i++)
x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k] ? p-1 : p++;
if(p >= n) break;
m = p;
}
} void getHeight(){
int i, j, k = 0;
for(i = 0; i < n; i++) rak[sa[i]] = i;
height[0] = 0;
for(i = 0; i < n; i++){
if(!rak[i]) continue; //注意判空!
if(k) k--; //height[rank[i]] >= height[rank[i-1]] - 1
j = sa[rak[i]-1]; //等级比i小1的后缀编号为j
while(s[i+k] == s[j+k]) k++;
height[rak[i]] = k;
}
} void solve(){
int len = strlen(s);
s[len] = '$';
s[len+1] = '\0';
strcat(s, s2);
n = strlen(s);
build_sa(256);
getHeight();
int Max = -1, i;
for(i = 1; i < n; i++) if((sa[i] >= 0 && sa[i] < len && sa[i-1] > len && sa[i-1] < n) || (sa[i-1] >= 0 && sa[i-1] < len && sa[i] > len && sa[i] < n)) Max = max(Max, height[i]);
printf("%d\n", Max);
} int main()
{
while(scanf("%s%s", s, s2) == 2) solve();
return 0;
}
poj - 2774 - Long Long Message的更多相关文章
- POJ 2774 Long Long Message [ 最长公共子串 后缀数组]
题目:http://poj.org/problem?id=2774 Long Long Message Time Limit: 4000MS Memory Limit: 131072K Total ...
- [POJ 2774] Long Long Message 【后缀数组】
题目链接:POJ - 2774 题目分析 题目要求求出两个字符串的最长公共子串,使用后缀数组求解会十分容易. 将两个字符串用特殊字符隔开再连接到一起,求出后缀数组. 可以看出,最长公共子串就是两个字符 ...
- POJ 2774 Long Long Message 后缀数组
Long Long Message Description The little cat is majoring in physics in the capital of Byterland. A ...
- poj 2774 Long Long Message 后缀数组基础题
Time Limit: 4000MS Memory Limit: 131072K Total Submissions: 24756 Accepted: 10130 Case Time Limi ...
- 后缀数组(模板题) - 求最长公共子串 - poj 2774 Long Long Message
Language: Default Long Long Message Time Limit: 4000MS Memory Limit: 131072K Total Submissions: 21 ...
- POJ 2774 Long Long Message(后缀数组)
[题目链接] http://poj.org/problem?id=2774 [题目大意] 求最长公共子串 [题解] 将两个串中间嵌一个字符相连,求一遍后缀数组 如果排名相邻的两个后缀的开端是分属于两个 ...
- ●POJ 2774 Long Long Message
题链: http://poj.org/problem?id=2774题解: 后缀自动机 使用后缀自动机匹配,思路如下: 即如果当前的x字符匹配失败了,就可以从当前已经匹配的串的后缀去继续匹配. 然后不 ...
- POJ 2774 Long Long Message (Hash + 二分)
Long Long Message Time Limit: 4000MS Memory Limit: 131072K Total Submissions: 34473 Accepted: 13 ...
- POJ 2774 Long Long Message&&HDU 1403 Longest Common Substring&&COJ 1203
后缀数组的买1送2题... HDU的那题数据实在是太水了,后来才发现在COJ和POJ上都是WA..原因在一点:在建立sa数组的时候里面的n应该是字符串长度+1....不懂可以去看罗大神的论文... 就 ...
随机推荐
- JavaScript对象(窗口对象 定时器对象 )
1:窗口时间 confirm(str):确认对话框,确认返回trun,取消返回false,但是必须要有两个return:不然就算按下取消也会提交 第一个return:用于保证确认按钮运行 <sc ...
- 给编译好的DLL增加签名
两个步骤,记录如下,主要用在silverlight中引用的dll要签名时: "C:\Program Files\Microsoft SDKs\Windows\v6.0A\Bin\ildasm ...
- HighChart 实现从后台取数据来实时更新柱状和折线组图
前段时间公司让弄图表,给我说有HighCharts这个js插件,于是上网上搜,由于本人是写后端的,对于JavaScript和jQuery不是很熟悉,虽然找到了模板,但是还是不明白,所以一点一点的改,但 ...
- Java中实现异常处理的基础知识
Java中实现异常处理的基础知识 异常 (Exception):发生于程序执行期间,表明出现了一个非法的运行状况.许多JDK中的方法在检测到非法情况时,都会抛出一个异常对象. 例如:数组越界和被0除. ...
- (转载)OC学习篇之---协议的概念和用法
在前一篇文章中我们介绍了OC中类的延展,这一篇文章我们在来看一下OC中协议的概念以及用法,协议也是OC中的一个重点,Foundation框架以及我们后面在写代码都会用到. OC中的协议就是相当于Jav ...
- CreateProcess error=206, The filename or extension is too long"的一个解决方案
在实际项目中我使用antrun 和 closure-compiler压缩JS项目.然后我就使用如下代码: 首先加入依赖. <dependency> <groupId>com.g ...
- What are some good resources for learning about Artificial Neural Networks
http://stackoverflow.com/questions/478947/what-are-some-good-resources-for-learning-about-artificial ...
- SQL Server常用元数据函数
元数据函数 1.获取数据库标识符DB_ID DB_ID函数用于获取当前数据库的唯一ID(int数据类型),数据库ID用于服务器上唯一区分书库. 语法结构: DB_ID (['database_name ...
- 著名加密库收集 Encrypt
CryptoAPI 微软的CryptoAPI crypt32.lib,advapi32.lib,cryptui.lib #include <wincrypt.h>#include < ...
- UDP广播问题
http://bbs.csdn.net/topics/390218123 Broadcast Address(广播地址)是专门用于同时向网络中所有工作站进行发送的一个地址.在使用TCP/IP 协议的网 ...