POJ 3294 二分找超过一半字符串中存在的子串
题目大意:
给定n个字符串,求出现在不小于k/2个字符串中的最长子串。
二分找对应子串长度的答案,将所有字符串链接成一个长字符串求后缀数组,记录每一个位置本属于第几个字符串,利用height查询的时候,
根据记录的位置不断判断是否出现重复的字符串是在同一个字符串内的
#include <cstdio>
#include <cstring>
#include <vector>
#include <iostream>
using namespace std;
typedef long long ll;
const int N = ;
int r[N] , sa[N] , rank[N] , height[N];
int K , wa[N] , wb[N] , wv[N] , wsf[N];
int cmp(int *r , int a , int b , int l){return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r , int *sa , int n , int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=;i<m;i++)wsf[i]=;
for(i=;i<n;i++)wsf[x[i]=r[i]]++;
for(i= ; i<m ; i++) wsf[i]+=wsf[i-];
for(i=n-;i>=;i--) sa[--wsf[x[i]]]=i;
for(j=,p=;p<n;j*=,m=p){
for(p=,i=n-j;i<n;i++) y[p++]=i;
for(i=;i<n;i++) if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=;i<n;i++) wv[i]=x[y[i]];
for(i=;i<m;i++) wsf[i]=;
for(i=;i<n;i++) wsf[wv[i]]++;
for(i=;i<m;i++) wsf[i]+=wsf[i-];
for(i=n-;i>=;i--) sa[--wsf[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=,x[sa[]]=,i=;i<n;i++)
x[sa[i]]=cmp(y,sa[i-],sa[i],j)?p-:p++;
}
return;
}
void callHeight(int *r , int *sa , int n)
{
int i,j,k=;
for(i=;i<=n;i++) rank[sa[i]]=i;
for(i=;i<n;height[rank[i++]]=k)
for(k?k--:,j=sa[rank[i]-];r[i+k]==r[j+k];k++);
return;
}
#define ll long long
int n , len , pos[][] , dif , mp[N];
bool vis[];
char s[][] , all[N];
vector<int> ans , tmp;
bool check(int mid)
{
tmp.clear();
bool flag = false;
memset(vis , , sizeof(vis));
int cnt = , rec = sa[];
vis[sa[]] = true;
for(int i= ; i<len ; i++){
if(height[i]<mid){
if(cnt>n/){
tmp.push_back(rec);
flag = true;
}
memset(vis , , sizeof(vis));
cnt = , vis[mp[sa[i]]] = true , rec = sa[i];
}
else{
if(!vis[mp[sa[i]]]){
vis[mp[sa[i]]] = true;
cnt++;
rec = sa[i];
}
}
}
if(flag) ans = tmp;
return flag;
}
int bin_search()
{
int l= , r= , ans= , mid;
while(l<=r){
mid = (l+r)>>;
if(check(mid)) l=mid+ , ans=mid;
else r=mid-;
}
return ans;
}
int main()
{
// freopen("a.in" , "r" , stdin);
bool flag = false;
while(scanf("%d" , &n) , n){
if(flag) puts("");
flag = true;
len = , dif = ;
for(int i= ; i<n ; i++){
scanf("%s" , s[i]);
for(int j= ; j<strlen(s[i]) ; j++) all[len] = s[i][j] , mp[len]=i+ , r[len++] = s[i][j]-'a'+;
pos[i][] = len;
all[len] = '*';
mp[len]=i+ , r[len++] = dif++;
}
r[len-] = ;
da(r , sa , len , dif);
// for(int i=0 ; i<len ; i++) cout<<"i: "<<i<<" "<<sa[i]<<endl;
callHeight(r , sa , len-);
int ret = bin_search();
if(!ret) puts("?");
else{
for(int i= ; i<ans.size() ; i++){
for(int j=ans[i] , t= ; t<ret ; j++ , t++) printf("%c" , all[j]);
puts("");
}
}
}
}
POJ 3294 二分找超过一半字符串中存在的子串的更多相关文章
- poj 3294 后缀数组 多字符串中不小于 k 个字符串中的最长子串
Life Forms Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 16223 Accepted: 4763 Descr ...
- 剑指Offer 找出字符串中第一个只出现一次的字符
题目描述 找出字符串中第一个只出现一次的字符 如果无此字符 请输出'.' 输入描述: 输入一串字符,由小写字母组成 输出描述: 输出一个字符 输入例子: asdfasdfo 输出例子: o 思路:数组 ...
- 找出字符串中第一个不重复的字符(JavaScript实现)
如题~ 此算法仅供参考,小菜基本不懂高深的算法,只能用最朴实的思想去表达. //找出字符串中第一个不重复的字符 // firstUniqueChar("vdctdvc"); --& ...
- HDU 4622 求解区间字符串中的不同子串的个数
题目大意: 给定一个长度<2000的串,再给最多可达10000的询问区间,求解区间字符串中的不同子串的个数 这里先考虑求解一整个字符串的所有不同子串的方法 对于后缀自动机来说,我们动态往里添加一 ...
- 【Java】获取两个字符串中最大相同子串
题目 获取两个字符串中最大相同子串 前提 两个字符串中只有一个最大相同子串 解决方案 public class StringDemo { public static void main(String[ ...
- [LeetCode] Find All Anagrams in a String 找出字符串中所有的变位词
Given a string s and a non-empty string p, find all the start indices of p's anagrams in s. Strings ...
- 【easy】438.Find All Anagrams in a String 找出字符串中所有的变位词
Input: s: "abab" p: "ab" Output: [0, 1, 2] Explanation: The substring with start ...
- js常会问的问题:找出字符串中出现次数最多的字符。
一.循环obj let testStr = 'asdasddsfdsfadsfdghdadsdfdgdasd'; function getMax(str) { let obj = {}; for(le ...
- 【SQLSERVER】如何找出字符串中的数字
可以通过写自定义函数实现,以下提供两种思路来解决: 1.通过正则匹配,找到字符串中的数字,一个一个拼起来 /*方法一: 一个一个找出来*/ CREATE FUNCTION [dbo].[Fun_Get ...
随机推荐
- .net连接DB2的异常SQL0666 - SQL query exceeds specified time limit or storage limit.错误处理
SQL0666 - SQL query exceeds specified time limit or storage limit. 原因:查询超时 解决办法: set the DbCommand.C ...
- div中的内容水平垂直居中
1. div高度自适应的情况 div在不设置高度的时候,会被里面的内容撑开,内容自动填充在div中,无论是一行内容还是多行内容,此时不需要设置垂直居中,内容自动在中间的, 想要看的更直观些,只需要加上 ...
- apt-get 与 yum 的区别
一般来说著名的 linux 系统基本上分两大类: RedHat系列:Redhat.CentOS.Fedora等 Debian系列:Debian.Ubuntu等 RedHat 系列 1 常见的安装包格式 ...
- 【java基础】成员变量和局部变量
成员变量和局部变量 根据定义变量位置的不同,可以将变量分为成员变量和局部变量 成员变量是在类范围内定义的变量 局部变量是在一个方法内定义的变量 成员变量可以分为: ...
- 统计学习中感知机的C++代码
感知机是古老的统计学习方法,主要应用于二类线性可分数据,策略是在给定的超平面上对误差点进行纠正,从而保证所有的点都是正确可分的. 用到的方法是随机梯度下降法,由于是线性可分的,可保证最终在有限步内收敛 ...
- node config
@echo off title node_5560 cd /d %~dp0 java -jar selenium-server-standalone-.jar ^ -role node ^ -Dweb ...
- EChart和G2比较
1.上市时间:EChart已经久经沙场,G2算是新事物 2.源码:截止发文,在Github上 数量 EChart G2 commits 3086 8 branches 3 1 releases 43 ...
- Python之路 day2 字符编码及转换
#!/usr/bin/env python # -*- coding:utf-8 -*- #Author:ersa import sys print("sys default encodin ...
- linux下使用yum安装Apache+php+Mysql+phpMyAdmin
适用redhat于32位及64位,前提架设好本地源.在这里不再赘述. 1 安装Apache+php+Mysql a.安装Apahce, PHP, Mysql, 以及php连接mysql库组件 yum ...
- 在linux上部署web环境
1.升级python到2.7版本(通过源码包重新安装一个2.7版本的python):wget https://www.python.org/ftp/python/2.7.9/Python-2.7.9. ...