P4303 [AHOI2006]基因匹配

标签(空格分隔): 考试题 nt题 LCS优化


【题目】

卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球上只有4种),而更奇怪的是,组成DNA序列的每一种碱基在该序列中正好出现5次!这样如果一个DNA序列有N种不同的碱基构成,那么它的长度一定是5N。

卡卡醒来后向可可叙述了这个奇怪的梦,而可可这些日子正在研究生物信息学中的基因匹配问题,于是他决定为这个奇怪星球上的生物写一个简单的DNA匹配程序。

为了描述基因匹配的原理,我们需要先定义子序列的概念:若从一个DNA序列(字符串)s中任意抽取一些碱基(字符),将它们仍按在s中的顺序排列成一个新串u,则称u是s的一个子序列。对于两个DNA序列s1和s2,如果存在一个序列u同时成为s1和s2的子序列,则称u是s1和s2的公共子序列。

卡卡已知两个DNA序列s1和s2,求s1和s2的最大匹配就是指s1和s2最长公共子序列的长度。

[任务] 编写一个程序:

从输入文件中读入两个等长的DNA序列;

计算它们的最大匹配;

向输出文件打印你得到的结果。

输入格式

输入文件中第一行有一个整数N,表示这个星球上某种生物使用了N种不同的碱基,以后将它们编号为1…N的整数

以下还有两行,每行描述一个DNA序列:包含5N个1…N的整数,且每一个整数在对应的序列中正好出现5次。

输出格式

输出文件中只有一个整数,即两个DNA序列的最大匹配数目。

输入输出样例

输入1

2

1 1 1 1 1 2 2 2 2 2

1 1 1 2 2 2 2 2 1 1

输出1

8

输入2

2

1 1 2 2 1 1 2 1 2 2

1 2 2 2 1 1 2 2 1 1

输出2

7

说明/提示

1≤N≤20000

【思路】

扯点别的

看此题前先观光一下前提级博客:https://www.cnblogs.com/614685877--aakennes/p/12663440.html,与本题密切相关。

考试时乍一看一个LCS板子,再一看数据范围,显然n²的效率A不了,于是乎就想起之前写过得一道题(上面那个博客),用lis优化lcs,时间效率为nlogn,但那道题显然有个限制条件:序列中所有的数都相等。这道题明确给出了重复的个数,一开始我就想用普通的5*x+cnt[x]来存,之后跟王子公主那道题一样,结果连样例都过不去(但竟然有50分),然后就摸了。

之后看到题解十分气愤,竟然真是王子公主的变种,很气。


正解

在王子公主中我们b序列中的一个数对应a序列中这个数的位置,然后对应到b序列中,最后跑一遍lis。这道题我们可以把b序列中的一个数对应到a序列中这个数的所有位置,倒序存进b序列里面。

问题1:为什么要存所有位置

表面上我们存进了所有的位置,实际上我们只需要用这些位置的某一个最优值就可以。拿样例2来说,我们倒序存入后,新数组:(1)8 6 5 2 1 |(2) 10 9 7 4 3 |(3) 10 9 7 4 3 |(4) 10 9 7 4 3 |(5) 8 6 5 2 1 |(6) 8 6 5 2 1 |(7) 10 9 7 4 3 |(8) 10 9 7 4 3 |(9) 8 6 5 2 1 |(10) 8 6 5 2 1 1,最长上升子序列的数依次来源于:第一个串的1,第二个串的3,第三个串的4,第五个串的5,第六个串的6,第七个串的7,第九个串的8。

问题2:为什么要倒序

每一个串一开始一定是一个上升的子序列,所以倒序后一定是一个下降的子序列,这样在跑lis的时候我们只会用到这个串中的一个数。相反,如果你不倒序,肯定就会用到这个串所有数,结果定然不对。

【代码】

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<cmath>
#include<map>
using namespace std;
const int maxn=1e6+5,maxe=250*250+5,INF=0x3f3f3f3f;
int n,f[maxn],a[20005][20005],b[maxn],low[maxn],cnt[maxn];
inline int read(){
int s=0,w=1;
char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')w=-1;ch=getchar();}
while(ch>='0'&&ch<='9') s=s*10+ch-'0',ch=getchar();
return s*w;
}
int main(){
freopen("a.in","r",stdin);
// freopen("dinning.out","w",stdout);
n=read();
int maxmax=0;
memset(low,0,sizeof(low));
for(int i=1;i<=n*5;i++){
int x=read();
a[++cnt[x]][x]=i;
}//a[cnt[x]][x]表示x在第一个序列中出现第cnt[x]次的位置
memset(cnt,0,sizeof(cnt));
int len=0;
for(int i=1;i<=n*5;i++){
int x=read();
for(int j=5;j>=1;j--)b[++len]=a[j][x];//倒序存入每一个串
}
int len1=1;
low[1]=b[1];
for(int i=2;i<=len;i++){
if(low[len1]<b[i])low[++len1]=b[i];
else low[lower_bound(low+1,low+len1+1,b[i])-low]=b[i];
}
printf("%d\n",len1);
}

OVER~

【线型DP】【LCS】洛谷P4303 [AHOI2006]基因匹配的更多相关文章

  1. 洛谷P4303 [AHOI2006]基因匹配(树状数组)

    传送门 我已经连这种傻逼题都不会了orz 正常的dp是$O(n^2)$的,枚举第一个数组的$j$,然后第二个数组的$k$,如果相等,则$dp[i]=dp[j]+1$,否则$dp[i]=dp[j]$ 然 ...

  2. 【线型DP】洛谷P2066 机器分配

    [线型DP]洛谷P2066 机器分配 标签(空格分隔): 线型DP [题目] 题目描述 总公司拥有高效设备M台,准备分给下属的N个分公司.各分公司若获得这些设备,可以为国家提供一定的盈利.问:如何分配 ...

  3. P4303 [AHOI2006]基因匹配 未完成

    题目 luogu 暴力60pts部分 显然如果没有出现次数==5的条件 显然是\(N_{2}\)的求lcs的模板 但是加点条件就完全不同了 思路 这个题短小精悍,不想数据结构那么傻逼无脑 我们考虑一下 ...

  4. 洛谷P1140 相似基因 (DP)

    洛谷P1140 相似基因 题目背景 大家都知道,基因可以看作一个碱基对序列.它包含了44种核苷酸,简记作A,C,G,TA,C,G,T.生物学家正致力于寻找人类基因的功能,以利用于诊断疾病和发明药物. ...

  5. BZOJ 1264: [AHOI2006]基因匹配Match( LCS )

    序列最大长度2w * 5 = 10w, O(n²)的LCS会T.. LCS 只有当a[i] == b[j]时, 才能更新答案, 我们可以记录n个数在第一个序列中出现的5个位置, 然后从左往右扫第二个序 ...

  6. bzoj 1264 [AHOI2006]基因匹配Match(DP+树状数组)

    1264: [AHOI2006]基因匹配Match Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 793  Solved: 503[Submit][S ...

  7. bzoj1264 [AHOI2006]基因匹配Match 树状数组+lcs

    1264: [AHOI2006]基因匹配Match Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 1255  Solved: 835[Submit][ ...

  8. BZOJ 1264: [AHOI2006]基因匹配Match 树状数组+DP

    1264: [AHOI2006]基因匹配Match Description 基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球 ...

  9. 【BZOJ1264】[AHOI2006]基因匹配Match DP+树状数组

    [BZOJ1264][AHOI2006]基因匹配Match Description 基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而 ...

随机推荐

  1. OC语言

    // // main.m // 测试题05 // // Created by yang sanchao on 9/12/15. // Copyright (c) 2015 yang sanchao. ...

  2. KVM虚拟机使用NAT+iptables做端口映射

    环境介绍 有一个KVM宿主机,一个外网IP绑定在了宿主服务器上,但是希望直接用ssh访问上面的所有虚拟机,还想虚拟机提供外网服务, 解决方法如下: 环境为RHEL6.3,外网IP为 61.155.xx ...

  3. 移动UI系列 - 简单地使用半衰期算法来预测手势的滑动方向与速度

    前言 有一个问题, 给定一个物体的运动轨迹, 包含时间和坐标的数组, 如何使用这个数据来预测物体未来的运动走势?? 本文提供了一个很简单的方式去实现这个算法. 效果够用, 又简单, 有一定的准确程度. ...

  4. Flask g 对象

    1.什么是g对象? 在 flask 中,有一个专门用来存储用户信息的 g 对象,g的全称的为global. g 对象在一次请求中的所有的代码的地方,都是可以使用的. 赋值方式 from flask i ...

  5. Java使用 Thumbnails 压缩图片

    业务:用户上传一张图片到文件站,需要返回原图url和缩略图url 处理思路: 因为上传图片方法返回url是单个上传,第一步先上传原图并返回url 处理缩略图并上传:拿到MultipartFile压缩成 ...

  6. 【百度前端技术学院 Day7/8】布局

    1. 定位 1.1 文档流 单个元素: 块级元素:内容宽度是其父元素的宽度的100%,并且与其内容一样高. 内联(行内)元素:高宽与他们的内容高宽一样.(所以不能为他们设置宽高) 元素之间的交互: 块 ...

  7. FR6安装问题备注

    好久以前偶尔用用FR,采用安装执行文件的方式(5.3版安装没问题).及其编译包的方式都没有问题,最近在6.x提示如下(fr6_5_11_all_ent等),不知是系统原因还是文件问题,未解: ---- ...

  8. sourcetree 安装破解注册方法

    1.下载sourcetree安装包 2.点击安装到下图步骤 3.在网盘中下载accounts.json  文件,( 链接:https://pan.baidu.com/s/1tJd_xCh-B-oOwd ...

  9. 如何用Python从海量文本抽取主题?

    摘自https://www.jianshu.com/p/fdde9fc03f94 你在工作.学习中是否曾因信息过载叫苦不迭?有一种方法能够替你读海量文章,并将不同的主题和对应的关键词抽取出来,让你谈笑 ...

  10. 测试人员遇到Android APP崩溃和无响应手足无措?

    这2天,在测APP兼容性时,遇到APP奔溃闪退的情况.将问题反馈给开发后,开发自己调试后,没有复现.由于又是远程,base地不在一块,我总不能把手机寄过去吧,那也太费事了. 所以就想到,提供明确的报错 ...