Poj 3294 Life Forms (后缀数组 + 二分 + Hash)
题目链接:
题目描述:
有n个文本串,问在一半以上的文本串出现过的最长连续子串?
解题思路:
可以把文本串用没有出现过的不同字符连起来,然后求新文本串的height。然后二分答案串的长度K,根据K把新文本串的后缀串分块,统计每块中的原文本串出现的次数,大于原文本串数目的一半就作为答案记录下来,对于输出字典序,height就是排好序的后缀数组,只要按照顺序输出即可。
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
typedef long long LL;
const int maxn = ; int sa[maxn], rank[maxn], height[maxn], vis[], res[maxn];
int t1[maxn], t2[maxn], r[maxn], flag[maxn], c[maxn]; bool cmp (int *str, int a, int b, int k)
{
return str[a]==str[b] && str[a+k]==str[b+k];
} void da (int *str, int n, int m)
{
n ++;
int *x = t1, *y = t2, i, j; for (i=; i<m; i++) c[i] = ;
for (i=; i<n; i++) c[x[i]=str[i]] ++;
for (i=; i<m; i++) c[i] += c[i-];
for (i=n-; i>=; i--) sa[-- c[x[i]]] = i; for (j=; j<=n; j*=)
{
int p = ;
for (i=n-j; i<n; i++) y[p++] = i;
for (i=; i<n; i++) if (sa[i] >= j) y[p++] = sa[i] - j; for (i=; i<m; i++) c[i] = ;
for (i=; i<n; i++) c[x[y[i]]] ++;
for (i=; i<m; i++) c[i] += c[i-];
for (i=n-; i>=; i--) sa[-- c[x[y[i]]]] = y[i]; swap (x, y);
p = ;
x[sa[]] = ;
for (int i=; i<n; i++)//i是rank
x[sa[i]] = cmp(y, sa[i-], sa[i], j)?p-:p++;
if (p >= n)
break;
m = p;
} for (i=; i<n; i++)
rank[sa[i]] = i; int k = ;
n --;
for (int i=; i<n; i++)
{
if (k) k --;
int j = sa[rank[i] - ];
while (str[i+k] == str[j+k]) k++;
height[rank[i]] = k;
}
} bool Bin_sreach (int x, int k, int n)
{
int ans, num;
ans = num = ;
memset (vis, , sizeof(vis)); for (int i=; i<=k; i++)
{
if (height[i] >= x)
{
ans += vis[flag[sa[i-]]]?:;
vis[flag[sa[i-]]] = ; ans += vis[flag[sa[i]]]?:;
vis[flag[sa[i]]] = ;
}
else
{
if (ans* > n)
res[++ num] = sa[i-]; ans = ;
memset (vis, , sizeof(vis));
}
}
if (ans* > n)
res[++ num] = sa[k-]; if (num)
{
res[] = num;
return true;
}
return false;
} int main ()
{
int n, l = ;
char str[];
while (scanf ("%d", &n), n)
{
if (l ++)
printf ("\n"); int k = ;
for (int i=; i<n; i++)
{
scanf ("%s", str);
for (int j=; str[j]; j++)
{
r[k] = str[j];
flag[k++] = i;//记录k字母所在的字符串
}
r[k] = + i;
flag[k++] = -;
} r[k] = ;
da (r, k, ); int low = , high = k, mid, ans = ;
while (low <= high)
{//二分枚举
mid = (low + high) / ;
if (Bin_sreach(mid, k, n))
{
ans = mid;
low = mid + ;
}
else
high = mid - ;
} if (low == )
{
printf ("?\n");
continue;
} for (int i=; i<=res[]; i++)
{
for (int j=res[i]; j<res[i]+ans; j ++)
printf ("%c", r[j]);
printf ("\n");
}
}
return ;
}
Poj 3294 Life Forms (后缀数组 + 二分 + Hash)的更多相关文章
- poj 3294 Life Forms - 后缀数组 - 二分答案
题目传送门 传送门I 传送门II 题目大意 给定$n$个串,询问所有出现在严格大于$\frac{n}{2}$个串的最长串.不存在输出'?' 用奇怪的字符把它们连接起来.然后求sa,hei,二分答案,按 ...
- POJ 3294 Life Forms 后缀数组+二分 求至少k个字符串中包含的最长子串
Life Forms Description You may have wondered why most extraterrestrial life forms resemble humans, ...
- Poj 1743 Musical Theme(后缀数组+二分答案)
Musical Theme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 28435 Accepted: 9604 Descri ...
- [poj 1743] Musical Theme 后缀数组 or hash
Musical Theme 题意 给出n个1-88组成的音符,让找出一个最长的连续子序列,满足以下条件: 长度大于5 不重叠的出现两次(这里的出现可以经过变调,即这个序列的每个数字全都加上一个整数x) ...
- Poj 3261 Milk Patterns(后缀数组+二分答案)
Milk Patterns Case Time Limit: 2000MS Description Farmer John has noticed that the quality of milk g ...
- POJ 1226 Substrings(后缀数组+二分答案)
[题目链接] http://poj.org/problem?id=1226 [题目大意] 求在每个给出字符串中出现的最长子串的长度,字符串在出现的时候可以是倒置的. [题解] 我们将每个字符串倒置,用 ...
- BZOJ 4278: [ONTAK2015]Tasowanie (后缀数组 / 二分+hash)
直接归并,然后如果哪边的后缀字典序比较小就去哪边,然后就可以后缀数组 博客传送门- 但是本蒟蒻不会后缀数组 Upd:Upd:Upd:现在会了233.一道差不多的题:BZOJ 1692: [Usaco2 ...
- BZOJ 1692: [Usaco2007 Dec]队列变换 (后缀数组/二分+Hash)
跟BZOJ 4278: [ONTAK2015]Tasowanie一模一样 SA的做法就是把原串倒过来接在原串后面,O(nlogn)O(nlogn)O(nlogn)做后缀数组,就能O(1)O(1)O(1 ...
- POJ3294--Life Forms 后缀数组+二分答案 大于k个字符串的最长公共子串
Life Forms Time Limit: 500 ...
随机推荐
- sublime text 3(Build 3103)最新注冊码
原来注冊过的sublime text 3近期更新了.没想到原来的注冊码就失效了,只是我找到了最新的注冊码(Build 3103),与大家分享一下(第一个亲測可用). -– BEGIN LICENSE ...
- 偏差-方差分解Bias-Variance Decomposition
转自: http://www.cnblogs.com/jmp0xf/archive/2013/05/14/Bias-Variance_Decomposition.html
- 【Nginx】Hello world程序
模块如何在运行中生效 配置文件中的location块决定了匹配某种URL的请求将会由相应的HTTP模块处理,因此,运行时HTTP框架会在接收完毕HTTP请求的头部后,将请求的URL与配置文件中的所有l ...
- Python筛选法(算出十亿之内所有的质数之和)
其实别人写的挺好的了....直接上链接吧http://blog.csdn.net/power721/article/details/8216619
- 【C#】无损转换Image为Icon 【C#】组件发布:MessageTip,轻快型消息提示窗 【C#】给无窗口的进程发送消息 【手记】WebBrowser响应页面中的blank开新窗口及window.close关闭本窗体 【手记】调用Process.EnterDebugMode引发异常:并非所有引用的特权或组都分配给呼叫方 【C#】DataRowState演变备忘
[C#]无损转换Image为Icon 如题,市面上常见的方法是: var handle = bmp.GetHicon(); //得到图标句柄 return Icon.FromHandle(handle ...
- Oracle学习(18)【DBA向】:分布式数据库
分布式数据库 什么是分布数据库? l数据物理上被存放在网络的多个节点上,逻辑上是一个总体. 分布式数据库的独立性 l分布数据的独立性指用户不必关心数据怎样切割和存储,仅仅需关心他须要什么数据. Ora ...
- 行转列--Excel和数据库的完美结合
入职到如今已经有一段时间了,除了不断完好新功能外,线上运维也是一项非常重要的任务,每天都须要占用一 定量的时间来处理,这时候如何高效准确的来解决这些问题是非常值得考虑的. 今天客服人员给我 ...
- JS文件中引用另一个JS文件
1.生产项目上遇到一个Bug,需要修改JS文件,添加Jquery代码,但是原来的页面没有添加对Jquery文件的引用,无法修改原来的页面(自动生成的HTML) 这就需要在JS文件中添加对Jquery文 ...
- POJ 3368 Frequent values RMQ ST算法/线段树
Frequent values Time Limit: 2000MS Memory Lim ...
- java8--Mysql数据库与JDBC编程(java疯狂讲义3复习笔记)
JDBC:java database connectivity 数据库基本命令: 启动 show databases; create database [if not exists] 数据库名; do ...