uva11107 后缀数组
题意给了n个串 然后计算 这些串中的子串在大于1/2的串中出现 求出这个串的最长长度。 将这些串用一个每出现的不同的字符拼起来 ,然后二分找lcp
#include <iostream>
#include <algorithm>
#include <string.h>
#include <algorithm>
#include <vector>
#include <cstdio>
using namespace std;
const int maxn=;
const int maxm=;
const int MM=maxn*maxm;
struct SuffixArray
{
int s[MM]; // 原始字符数组(最后一个字符应必须是0,而前面的字符必须非0)
int sa[MM]; // 后缀数组
int rank[MM]; // 名次数组. rank[0]一定是n-1,即最后一个字符
int height[MM]; // height数组
int t[MM], t2[MM], c[MM]; // 辅助数组
int n; // 字符个数
void clear(){ n=; }
void build(int m)
{
int *x=t,*y=t2,i;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[i] = s[i] ]++;
for(i=; i<m; i++)c[ i ] += c[ i- ];
for(i = n-; i >= ; i--) sa[--c[x[i]]] = i;
for(int k=; k<=n; k<<=)
{
int p=;
for(i=n-k; i<n; i++)y[p++]=i;
for(i=; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[y[ i] ] ]++;
for(i=; i<m; i++)c[i]+=c[i-];
for(i =n-; i>=; i--)sa[ --c[ x[ y[i] ] ] ] = y[i];
swap(x,y);
p=;
x[ sa[] ] =;
for( i=; i<n; i++) x[ sa[i] ]= y[ sa[i] ]==y[sa[i-]] && y[ sa[i]+k ]== y[ sa[i-] +k ]?p-:p++;
if(p>=n)break;
m=p;
}
}
void build_height() {
int i, k = ;
for(i = ; i < n; i++) rank[sa[i]] = i;
height[]=;
for(i = ; i < n; i++) {
if(k) k--;
if(rank[i]==)continue;
int j = sa[rank[i]-];
while(i+k<n&&j+k<n&&s[i+k] == s[j+k]) k++;
height[rank[i]] = k;
}
}
}sa;
char word[MM];
int idx[MM],n,maxlen;
int flag[];
void add(int ch, int i)
{
idx[sa.n] = i;
sa.s[sa.n++] = ch;
}
// 子串[L,R) 是否符合要求
bool good(int L, int R,int &ss)
{ if(R - L <= n/) return false;
int cnt = ;
for(int i = L; i < R; i++) {
int x = idx[sa.sa[i]];
if(x != n && flag[x]!=ss) { flag[x] = ss; cnt++; }
}
return cnt > n/;
} void print_sub(int L, int R)
{
for(int i = L; i < R; i++)
printf("%c", sa.s[i] - + 'a');
printf("\n");
}
int ss;
bool print_solutions(int len, bool print)
{
int L = ;
ss++;
for(int R = ; R <= sa.n; R++) {
if(R == sa.n || sa.height[R] < len) { // 新开一段
if(good(L, R,ss)) {
if(print) print_sub(sa.sa[L], sa.sa[L] + len); else return true;
}
ss++;
L = R;
}
}
return false;
} void solve(int maxlen)
{
if(!print_solutions(, false))
printf("?\n");
else {
int L = , R = maxlen, M;
while(L < R) {
M = L + (R-L+)/;
if(print_solutions(M, false)) L = M;
else R = M-;
}
print_solutions(L, true);
}
} int main()
{
int kase=;
while(scanf("%d",&n)==)
{
if(n==)break;
if(kase++>) puts("");
maxlen=;
sa.clear();
for(int i=; i<n; i++)
{
scanf("%s",word);
int sz= strlen(word);
maxlen=max(sz,maxlen);
for(int j=; j<sz; j++)
{
add(word[j]-'a'+,i);
}
add(+i,n);
}
add(+n,n);
if(n==)printf("%s\n",word);
else
{
ss=;
memset(flag,,sizeof(flag));
sa.build( +n+ );
sa.build_height();
solve(maxlen);
}
}
return ;
}
uva11107 后缀数组的更多相关文章
- UVA11107 Life Forms --- 后缀数组
UVA11107 Life Forms 题目描述: 求出出现在一半以上的字符串内的最长字符串. 数据范围: \(\sum len(string) <= 10^{5}\) 非常坑的题目. 思路非常 ...
- uva11107(后缀数组)
uva11107 题意 输入 n 个 DNA 序列,求出长度最大的字符串,使得它在超过一半的 DNA 序列中连续出现.如果有多解,按字典序输出. 分析 论文 后缀数组经典题.加深几个关键数组的印象. ...
- 【UVA11107 训练指南】Life Forms【后缀数组】
题意 输入n(n<=100)个字符串,每个字符串长度<=1000,你的任务是找出一个最长的字符串使得超过一半的字符串都包含这个字符串. 分析 训练指南上后缀数组的一道例题,据说很经典(估计 ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- host.conf 文件
/etc/host.conf文件的作用是设置名称解析时的先后顺序/etc/hosts文件是在使用host解析时,手动的添加的主机记录/etc/relov.conf文件中设置DNS服务器名称以及缺省的域 ...
- linux系统中关于shell变量$*与$@的区别
在我们初学linux系统shell时,可能会感觉$@与$*没什么区别,如下面shell脚本: #!/bin/bash# name:a.sh # echo 'this script $* is: '$* ...
- VB学习之路基础(一)
1.VB不区分大小定,VB编辑器会自动更正. 2.每一行代码语句,没有语句结束符. 3.续行符:一个"空格"加上一个"下划线".不能在参数中间加续行符. 5.合 ...
- Unity3D笔记 英保通二
一.访问另一个物体 1.代码中定义一个public的物体 例如:var target:Transform; 在面板上直接拖拽一个物体赋值给target 2.通过GameObject.Find(&quo ...
- ELKStack
ELKStack简介 对于日志来说,最常见的需求就是收集.存储.查询.展示,开源社区正好有相对应的开源项目:logstash(收集).elasticsearch(存储+搜索).kiban ...
- 天梯赛 大区赛 L3-014.周游世界 (Dijkstra)
L3-014. 周游世界 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 周游世界是件浪漫事,但规划旅行路线就不一定了-- 全世 ...
- python2.X编码
1.Python文件的编码 在Python文件中,可以在第一或第二行指定文件的编码格式(以注释的形式加),这也是Python语法规定的,见http://www.python.org/peps/pep- ...
- Java并发包中CyclicBarrier的源码分析和使用
CyclicBarrier的介绍和源码分析 CyclicBarrier的字母意思是可循环(Cyclic)使用的屏障(Barrier).它要做的事情是,让一组线程到达一个屏障(也可以叫做同步点)时被阻塞 ...
- mysql 数据备份与恢复
1.mysql的备份 命令:"mysqldump -u root -p 数据库名 [表名] > 备份文件名" 不写表名默认备份所有整个数据库. 注意:备份的文件中没有创建数据 ...
- [运维-安全]CentOS7.0环境下安装kangle和easypanel
一.康乐简介 主要特点1.免费开源kangle技术团队希望国人拥有一款真正好用.易用.实用的国产web服务器.2.跨平台可在linux.windows.freebsd.openbsd.netbsd.s ...