uva11107 后缀数组
题意给了n个串 然后计算 这些串中的子串在大于1/2的串中出现 求出这个串的最长长度。 将这些串用一个每出现的不同的字符拼起来 ,然后二分找lcp
#include <iostream>
#include <algorithm>
#include <string.h>
#include <algorithm>
#include <vector>
#include <cstdio>
using namespace std;
const int maxn=;
const int maxm=;
const int MM=maxn*maxm;
struct SuffixArray
{
int s[MM]; // 原始字符数组(最后一个字符应必须是0,而前面的字符必须非0)
int sa[MM]; // 后缀数组
int rank[MM]; // 名次数组. rank[0]一定是n-1,即最后一个字符
int height[MM]; // height数组
int t[MM], t2[MM], c[MM]; // 辅助数组
int n; // 字符个数
void clear(){ n=; }
void build(int m)
{
int *x=t,*y=t2,i;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[i] = s[i] ]++;
for(i=; i<m; i++)c[ i ] += c[ i- ];
for(i = n-; i >= ; i--) sa[--c[x[i]]] = i;
for(int k=; k<=n; k<<=)
{
int p=;
for(i=n-k; i<n; i++)y[p++]=i;
for(i=; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(i=; i<m; i++)c[i]=;
for(i=; i<n; i++)c[ x[y[ i] ] ]++;
for(i=; i<m; i++)c[i]+=c[i-];
for(i =n-; i>=; i--)sa[ --c[ x[ y[i] ] ] ] = y[i];
swap(x,y);
p=;
x[ sa[] ] =;
for( i=; i<n; i++) x[ sa[i] ]= y[ sa[i] ]==y[sa[i-]] && y[ sa[i]+k ]== y[ sa[i-] +k ]?p-:p++;
if(p>=n)break;
m=p;
}
}
void build_height() {
int i, k = ;
for(i = ; i < n; i++) rank[sa[i]] = i;
height[]=;
for(i = ; i < n; i++) {
if(k) k--;
if(rank[i]==)continue;
int j = sa[rank[i]-];
while(i+k<n&&j+k<n&&s[i+k] == s[j+k]) k++;
height[rank[i]] = k;
}
}
}sa;
char word[MM];
int idx[MM],n,maxlen;
int flag[];
void add(int ch, int i)
{
idx[sa.n] = i;
sa.s[sa.n++] = ch;
}
// 子串[L,R) 是否符合要求
bool good(int L, int R,int &ss)
{ if(R - L <= n/) return false;
int cnt = ;
for(int i = L; i < R; i++) {
int x = idx[sa.sa[i]];
if(x != n && flag[x]!=ss) { flag[x] = ss; cnt++; }
}
return cnt > n/;
} void print_sub(int L, int R)
{
for(int i = L; i < R; i++)
printf("%c", sa.s[i] - + 'a');
printf("\n");
}
int ss;
bool print_solutions(int len, bool print)
{
int L = ;
ss++;
for(int R = ; R <= sa.n; R++) {
if(R == sa.n || sa.height[R] < len) { // 新开一段
if(good(L, R,ss)) {
if(print) print_sub(sa.sa[L], sa.sa[L] + len); else return true;
}
ss++;
L = R;
}
}
return false;
} void solve(int maxlen)
{
if(!print_solutions(, false))
printf("?\n");
else {
int L = , R = maxlen, M;
while(L < R) {
M = L + (R-L+)/;
if(print_solutions(M, false)) L = M;
else R = M-;
}
print_solutions(L, true);
}
} int main()
{
int kase=;
while(scanf("%d",&n)==)
{
if(n==)break;
if(kase++>) puts("");
maxlen=;
sa.clear();
for(int i=; i<n; i++)
{
scanf("%s",word);
int sz= strlen(word);
maxlen=max(sz,maxlen);
for(int j=; j<sz; j++)
{
add(word[j]-'a'+,i);
}
add(+i,n);
}
add(+n,n);
if(n==)printf("%s\n",word);
else
{
ss=;
memset(flag,,sizeof(flag));
sa.build( +n+ );
sa.build_height();
solve(maxlen);
}
}
return ;
}
uva11107 后缀数组的更多相关文章
- UVA11107 Life Forms --- 后缀数组
UVA11107 Life Forms 题目描述: 求出出现在一半以上的字符串内的最长字符串. 数据范围: \(\sum len(string) <= 10^{5}\) 非常坑的题目. 思路非常 ...
- uva11107(后缀数组)
uva11107 题意 输入 n 个 DNA 序列,求出长度最大的字符串,使得它在超过一半的 DNA 序列中连续出现.如果有多解,按字典序输出. 分析 论文 后缀数组经典题.加深几个关键数组的印象. ...
- 【UVA11107 训练指南】Life Forms【后缀数组】
题意 输入n(n<=100)个字符串,每个字符串长度<=1000,你的任务是找出一个最长的字符串使得超过一半的字符串都包含这个字符串. 分析 训练指南上后缀数组的一道例题,据说很经典(估计 ...
- 后缀数组的倍增算法(Prefix Doubling)
后缀数组的倍增算法(Prefix Doubling) 文本内容除特殊注明外,均在知识共享署名-非商业性使用-相同方式共享 3.0协议下提供,附加条款亦可能应用. 最近在自学习BWT算法(Burrows ...
- BZOJ 4199: [Noi2015]品酒大会 [后缀数组 带权并查集]
4199: [Noi2015]品酒大会 UOJ:http://uoj.ac/problem/131 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 [后缀数组 贪心]
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1383 Solved: 582[Submit][St ...
- POJ3693 Maximum repetition substring [后缀数组 ST表]
Maximum repetition substring Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9458 Acc ...
- POJ1743 Musical Theme [后缀数组]
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 27539 Accepted: 9290 De ...
- 后缀数组(suffix array)详解
写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具. 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料. 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, ...
随机推荐
- kvm虚拟机的重命名
1.查看所有的kvm虚拟机 [root@5201351_kvm ~]# virsh list --all 2.重命名kvm虚拟机最好是将虚拟机先关机,然后再导出其xml文件 [root@5201351 ...
- JSPatch - 基本使用和学习
介绍 JSPatch是2015年由bang推出的能实现热修复的工具,只要在项目中引入极小的JSPatch引擎,就可以用 JavaScript 调用和替换任何 Objective-C 的原生方法,获得脚 ...
- Java语言快速实现简单MQ消息队列服务
目录 MQ基础回顾 主要角色 自定义协议 流程顺序 项目构建流程 具体使用流程 代码演示 消息处理中心 Broker 消息处理中心服务 BrokerServer 客户端 MqClient 测试MQ 小 ...
- 被included或者被required的文件都来自哪里呢
过PHP,你可以使用不同函数帮助你重用代码.具体用到的函数取决于你打算重用的内容. 主函数如下: * include() and include_once() * require() and requ ...
- HDU 6343 - Problem L. Graph Theory Homework - [(伪装成图论题的)简单数学题]
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6343 Time Limit: 2000/1000 MS (Java/Others) Memory Li ...
- tkinter 提示符
在python3.4中,原来的tkMessageBox变成tkinter.messagebox,使用方式如下: import tkinter.messagebox tkinter.messagebox ...
- Python 核实文件是否存在的函数
经常会用到的文件读取,首先要检测文件的状态 # 核实文件是否存在 # Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能. # format ...
- Codeforces Round #435 (Div. 2)
A. Mahmoud and Ehab and the MEX 题目链接:http://codeforces.com/contest/862/problem/A 题目意思:现在一个数列中有n个数,每个 ...
- iOS多线程编程之创建线程安全(转载)
一.多线程的安全隐患 资源共享 1块资源可能会被多个线程共享,也就是多个线程可能会访问同一块资源 比如多个线程访问同一个对象.同一个变量.同一个文件 当多个线程访问同一块资源时,很容易引发数据错乱和数 ...
- Zhu and 772002---hdu5833(高斯消元解求异或方程组)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5833 题意:给n个数,选择一些数字乘积为平方数的选择方案数. 分析:每一个数字分解质因数.比如4, 6 ...