SYZOJP186 你猜猜是不是DP题解

题目传送门

现在给两个仅包含小写字母的字符串a,b ,求a 与b的最长公共连续子串的长度。

对于20%的数据,a,b长度 ∈ [1, 200]

对于50%的数据,a,b长度 ∈ [1, 20000]

对于100%的数据, a,b长度 ∈ [1, 200000]

分析

根据数据规模,DP肯定是要GG的

应该是要用比较神奇的字符串算法,但是本题猪油一组测试数据,经过计算,发现二分答案+hash函数可以通过。

做法

  1. 此题可以二分答案长度len

    1. 计算两个字符串各个起点长度为len的子串hash得两hash数组A,B。并从大到小排序。
    2. 两个指针p,q分别指向A,B数组。从前往后扫描。
      1. 如果p,q所指元素hash相等。

        a. A数组中所有hash值和p所指元素相同的元素构成的集合为AA。

        b. 同理有集合BB。

        c. AA和BB的集合都需要两两检验是否有相同子串。

        d. 有则标记跳出。

        e. 若都无,p,q后移。
      2. 不相等,则hash值大者后移。

复杂度

排序

O(Llog2L)" role="presentation">O(Llog2L)O(Llog2L)

总的期望

O(Llog22L)" role="presentation">O(Llog22L)O(Llog22L)

貌似如果AA集合和BB集合都含有大量元素,规模相当于O(L)" role="presentation" style="position: relative;">O(L)O(L) ,且实际上每个字串优势不想等的则复杂度就O(L2log2L)" role="presentation" style="position: relative;">O(L2log2L)O(L2log2L)

但这种出现的概率应当是比中五百万彩票还要小

以此O(Llog22L)" role="presentation" style="position: relative;">O(Llog22L)O(Llog22L)再与108" role="presentation" style="position: relative;">108108相比得0.35左右。故应当可以AC

/*
653 ms 6500 K C++ / 2.1 K
*/
#include <cstdio>
#include <cstring>
#include <string>
#include <iostream>
#include <cstdlib>
#include <algorithm>
using namespace std;
typedef unsigned long long ULL;
void hash(string &s,ULL h[],ULL g[],ULL C)
{
h[s.length()]=0;
for (int i=s.length()-1;i>=0;--i)
h[i]=h[i+1]*C+s[i];
g[0]=1;
for (size_t i=1;i<=s.length();++i)
g[i]=g[i-1]*C;
} ULL sub_hash(int i,int j,ULL h[],ULL g[])//[i,j)
{
return h[i]-h[j]*g[j-i];
}
const int maxl=200005;
string a,b;
ULL ga[maxl],ha[maxl],gb[maxl],hb[maxl];
ULL C=131;
struct nd{
ULL h;
int i;
}A[maxl],B[maxl];
bool operator <(nd a,nd b)
{
return a.h>b.h;
}
int main()
{
int ans,l,r,m,len,la,lb,ka,kb;
cin>>a>>b;
hash(a,ha,ga,C);
hash(b,hb,gb,C);
la=a.length(); lb=b.length();
l=0; r=min(la,lb)+1;
//ans is in [l,r)
while (l+1<r) {
len=m=(l+r+1)/2;
ka=la-len+1; kb=lb-len+1;
for (int i=0;i<ka;++i) {
A[i].i=i;
A[i].h=sub_hash(i,i+len,ha,ga);
}
for (int i=0;i<kb;++i) {
B[i].i=i;
B[i].h=sub_hash(i,i+len,hb,gb);
}
sort(A,A+ka);
sort(B,B+kb);
bool ok=false;
int p=0,q=0;
int same_ar,same_br;
int u,v;
while (!ok&&p<ka&&q<kb) {
if (A[p].h==B[q].h) {
for (same_ar=p+1;same_ar<ka;++same_ar) if (A[p].h!=A[same_ar].h) break;
for (same_br=q+1;same_br<kb;++same_br) if (B[q].h!=B[same_br].h) break;
for (u=p;!ok&&u<same_ar;u++)
for (v=q;v<same_br;v++)
if (a.substr(A[u].i,len)==b.substr(B[v].i,len)) {
ok=true;break;
}
p=same_ar;q=same_br;
} else if (A[p].h>B[q].h) {
++p;
} else {
++q;
}
}
if (ok) {
l=m;
} else {
r=m;
}
}
ans=l;
cout<<ans<<endl;
}

SYZOJP186 你猜猜是不是DP 二分+hash解法的更多相关文章

  1. CF#633C Spy Syndrome 2 DP+二分+hash

    Spy Syndrome 2 题意 现在对某个英文句子,进行加密: 把所有的字母变成小写字母 把所有的单词反过来 去掉单词之间的空格 比如:Kira is childish and he hates ...

  2. 两种解法-树形dp+二分+单调队列(或RMQ)-hdu-4123-Bob’s Race

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4123 题目大意: 给一棵树,n个节点,每条边有个权值,从每个点i出发有个不经过自己走过的点的最远距离 ...

  3. hdu 1025:Constructing Roads In JGShining's Kingdom(DP + 二分优化)

    Constructing Roads In JGShining's Kingdom Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65 ...

  4. YbtOJ#526-折纸游戏【二分,hash】

    正题 题目链接:https://www.ybtoj.com.cn/problem/526 题目大意 一个\(n\times m\)的网格上有字母,你每次可以沿平行坐标轴对折网格,要求对折的对应位置字母 ...

  5. BZOJ 1014: [JSOI2008]火星人prefix [splay 二分+hash] 【未完】

    1014: [JSOI2008]火星人prefix Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 6243  Solved: 2007[Submit] ...

  6. HDU 3433 (DP + 二分) A Task Process

    题意: 有n个员工,每个员工完成一件A任务和一件B任务的时间给出,问要完成x件A任务y件B任务所需的最短时间是多少 思路: DP + 二分我也是第一次见到,这个我只能说太难想了,根本想不到. dp[i ...

  7. POJ-2533最长上升子序列(DP+二分)(优化版)

    Longest Ordered Subsequence Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 41944   Acc ...

  8. hdu2993之斜率dp+二分查找

    MAX Average Problem Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Othe ...

  9. poj3208 Apocalypse Someday 数位dp+二分 求第K(K <= 5*107)个有连续3个6的数。

    /** 题目:poj3208 Apocalypse Someday 链接:http://poj.org/problem?id=3208 题意:求第K(K <= 5*107)个有连续3个6的数. ...

随机推荐

  1. MySQL中大数据表增加字段,增加索引实现

    MySQL中大数据表增加字段,通过增加索引实现 普通的添加字段sql ALTER TABLE `table_name` ADD COLUMN `num` int(10) NOT NULL DEFAUL ...

  2. 大数据运维尖刀班 | 集群_监控_CDH_Docker_K8S_两项目_腾讯云服务器

    说明:大数据时代,传统运维向大数据运维升级换代很常见,也是个不错的机会.如果想系统学习大数据运维,个人比较推荐通信巨头运维大咖的分享课:https://url.cn/5HIqOOr,主要是实战强.含金 ...

  3. ES[7.6.x]学习笔记(一)Elasticsearch的安装与启动

    Elasticsearch是一个非常好用的搜索引擎,和Solr一样,他们都是基于倒排索引的.今天我们就看一看Elasticsearch如何进行安装. 下载和安装 今天我们的目的是搭建一个有3个节点的E ...

  4. 彻底搞懂flex弹性盒模型布局

    为什么要用flex 基于css3简单方便,更优雅的实现,浏览器兼容性好,传统的css实现一个div居中布局要写一堆代码,而现在几行代码就搞定了,没有理由不用flex. 兼容性: Base Browse ...

  5. mysql 使用 limit ,从指定条数读取完,-1失效

    , 原因很简单这种写法本身就是错的,虽然它可以在之前的版本中运行(低优先级),新版本的mysql对此做出了修复,现在的替代方法是第二个参数用一个较大的正数代替 比如你写个 , 感觉这方法很蠢,然鹅我并 ...

  6. Linux学习Day6:编写Shell脚本

    Shell脚本命令的工作方式有两种: 交互式(Interactive):用户每输入一条命令就立即执行. 批处理(Batch):由用户事先编写好一个完整的Shell脚本,Shell会一次性执行脚本中诸多 ...

  7. AB实验人群定向HTE模型5 - Meta Learner

    Meta Learner和之前介绍的Casual Tree直接估计模型不同,属于间接估计模型的一种.它并不直接对treatment effect进行建模,而是通过对response effect(ta ...

  8. web自动化之三大等待

    这个假期有些长,长到忘记了要学习,要找工作,好吧,在我每天无休止的追着偶像剧时,我确实没有负罪感,在听了小祥大佬的分享后,我连睡午觉都被吓醒.大佬跟我同一个班,在大厂工作,每天还抽时间学习,作业也没落 ...

  9. iMacros 入门教程-基础函数介绍(2)

    imacros 的 pos 参数是什么意思 position的缩写,如果有 2 个以上的元素共用完全相同的属性(比方说同一个小区的同一栋楼),这个 POS 的参数可以借由不同位置来帮助明确定位(也就是 ...

  10. Linux高性能服务器编程:Linux服务器程序规范

    Linux服务器程序一般以后台进程形式运行,后台进程又称守护进程.它没有控制终端,不会接收到用户输入.守护进程的父进程通常是init进程(PID为1). Linux服务器程序有一套日志系统 Linux ...