POJ 3691 DNA repair (DP+AC自动机)
Time Limit: 2000MS | Memory Limit: 65536K | |
Total Submissions: 4815 | Accepted: 2237 |
Description
Biologists finally invent techniques of repairing DNA that contains segments causing kinds of inherited diseases. For the sake of simplicity, a DNA is represented as a string containing characters 'A', 'G' , 'C' and 'T'. The repairing techniques are simply to change some characters to eliminate all segments causing diseases. For example, we can repair a DNA "AAGCAG" to "AGGCAC" to eliminate the initial causing disease segments "AAG", "AGC" and "CAG" by changing two characters. Note that the repaired DNA can still contain only characters 'A', 'G', 'C' and 'T'.
You are to help the biologists to repair a DNA by changing least number of characters.
Input
The following N lines gives N non-empty strings of length not greater than 20 containing only characters in "AGCT", which are the DNA segments causing inherited disease.
The last line of the test case is a non-empty string of length not greater than 1000 containing only characters in "AGCT", which is the DNA to be repaired.
The last test case is followed by a line containing one zeros.
Output
number of characters which need to be changed. If it's impossible to repair the given DNA, print -1.
Sample Input
2
AAA
AAG
AAAG
2
A
TG
TGAATG
4
A
G
C
T
AGT
0
Sample Output
Case 1: 1
Case 2: 4
Case 3: -1
Source
所谓的AC自动机上的DP,就是说在AC自动机上转移,那么如果目标串不包含任何一个病毒串,那么它在Trie图上就不可能匹配成功,既然如此,那么以Trie图上某个结点为状态的DP就可以实施了......
具体先说建AC自动机,就有一个特殊的地方:
①:为什么要设立虚节点? 其实这个是为了底下状态转移用的,如果这个节点底下是空的,那么我们再转移时就是回到跟,因为相当于匹配完了某一个病毒串了,我们应该再匹配所有的有可能的病毒串了,如果这里不建立虚的节点,那么就需要一些特殊判定.... 会很麻烦。
②: 小主意一点就是如果某个点的fail指针指向点是危险节点,那么这个点也必然是危险节点(这是显然的)。
然后就是DP方程: f(i,j)表示主串匹配到第i位时在自动机上的状态为j时的最少修改次数,方程大家先看着:
f(i,j.son(就是字典树的next数组))=min(f(i,j.son),f(i-1,j)+(j.son!=hash(str[i-1]))) 字符串第一位是存在0那里。(若j.son是病毒串,那么不能转移)
先看最主要的一个问题: 状态这个j.son怎么理解: 比如说当前Trie图上主串走到了abb然后开始往abbb上转移,即j.son==b,然后发现主串中第四个位置是c之类的,反正不等于b,那么想要转移过来怎么办,那么很简单,+1也就是直接修改成b即可,即有abbc变成了abbb....
这就是AC自动机上的DP的个人认为的关键地方,那么虚拟节点的解释就很好理解了,就是它应该回到根节点去跟其他的病毒串去匹配啦....
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm> using namespace std; const int N=;
const int INF=0x3f3f3f3f; struct Trie{
int ok;
Trie *fail;
Trie *next[];
void init(){
ok=;
fail=NULL;
memset(next,NULL,sizeof(next));
}
}*root,*q[N],a[N]; char wrd[];
char str[N];
int n,cnt,dp[N][N]; int find(char ch){
switch(ch){
case 'A':return ;
case 'C':return ;
case 'T':return ;
case 'G':return ;
}
return ;
} void InsertTrie(char *str){
Trie *loc=root;
for(int i=;str[i]!='\0';i++){
int id=find(str[i]);
if(loc->next[id]==NULL){
a[cnt].init();
loc->next[id]=&a[cnt++];
}
loc=loc->next[id];
}
loc->ok=;
} void AC_automation(){
int head=,tail=;
root->fail=NULL;
q[tail++]=root;
Trie *cur,*tmp;
while(head<tail){
cur=q[head++];
tmp=NULL;
for(int i=;i<;i++){
if(cur->next[i]==NULL){
if(cur==root) //方便DP
cur->next[i]=root;
else
cur->next[i]=cur->fail->next[i];
}else{
tmp=cur->fail;
while(tmp!=NULL){
if(tmp->next[i]!=NULL){
cur->next[i]->fail=tmp->next[i];
cur->next[i]->ok |= tmp->next[i]->ok;
break; //注意退出循环
}
tmp=tmp->fail;
}
if(tmp==NULL)
cur->next[i]->fail=root;
q[tail++]=cur->next[i];
}
}
}
} int main(){ //freopen("input.txt","r",stdin); int cases=;
while(~scanf("%d",&n) && n){
cnt=;
root=&a[cnt++];
root->init();
for(int i=;i<n;i++){
scanf("%s",wrd);
InsertTrie(wrd);
}
AC_automation();
scanf("%s",str);
int len=strlen(str);
for(int i=;i<N;i++)
for(int j=;j<N;j++)
dp[i][j]=INF;
dp[][]=;
for(int i=;i<=len;i++)
for(int j=;j<cnt;j++)
for(int k=;k<;k++){
Trie *tmp=a[j].next[k];
if(tmp->ok)
continue;
int dis=tmp-root;
dp[i][dis]=min(dp[i][dis],dp[i-][j]+(k!=find(str[i-])));
}
int ans=INF;
for(int i=;i<cnt;i++)
if(ans>dp[len][i])
ans=dp[len][i];
printf("Case %d: ",++cases);
if(ans==INF)
printf("-1\n");
else
printf("%d\n",ans);
}
return ;
}
POJ 3691 DNA repair (DP+AC自动机)的更多相关文章
- poj 3691 DNA repair(AC自己主动机+dp)
DNA repair Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 5877 Accepted: 2760 Descri ...
- poj3691 DNA repair[DP+AC自动机]
$给定 n 个模式串,和一个长度为 m 的原串 s,求至少修改原串中的几个字符可以使得原串中不包含任一个模式串.模式串总长度 ≤ 1000,m ≤ 1000.$ 先建出模式串的AC自动机,然后考虑怎么 ...
- POJ 3691 DNA repair 基于AC自己主动机DP
dp[i][j] 它表示的长度 i 下游前缀 j 更改节点的最小数量. 很清楚dp[0][0] = 0; dp[ i ][ j ] = min(dp[ i ][ j ],dp[i-1][k] + (j ...
- POJ 3691 DNA Sequence (AC自动机 + 矩阵 有bug,待修改)
DNA Sequence Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 9889 Accepted: 3712 Desc ...
- POJ 3691 DNA repair (DP+字符串)
题意:给出nn(1≤n≤50,1≤n≤50) 个病毒DNA序列,长度均不超过20.现在给出一个长度不超过1000的字符串,求至少要更换多少个字符, 才能使这个字符串不包含这些DNA序列. 析:利用前缀 ...
- HDU 2457 DNA repair(AC自动机+DP)题解
题意:给你几个模式串,问你主串最少改几个字符能够使主串不包含模式串 思路:从昨天中午开始研究,研究到现在终于看懂了.既然是多模匹配,我们是要用到AC自动机的.我们把主串放到AC自动机上跑,并保证不出现 ...
- HDU 2457/POJ 3691 DNA repair AC自动机+DP
DNA repair Problem Description Biologists finally invent techniques of repairing DNA that contains ...
- POJ 3691 DNA repair(AC自动机+DP)
题目链接 能AC还是很开心的...此题没有POJ2778那么难,那个题还需要矩阵乘法,两个题有点相似的. 做题之前,把2778代码重新看了一下,回忆一下当时做题的思路,回忆AC自动机是干嘛的... 状 ...
- HDU 2425 DNA repair (AC自动机+DP)
DNA repair Time Limit: 5000/2000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total ...
随机推荐
- 【BZOJ】【2120】数颜色 & 【2453】维护队列
莫队算法 分块大法吼 这题乍一看跟HH的项链很像啊……只是多了一个修改操作……然而我就不会做了
- Centos下运行cp命令式提示略过目录
今天在复制一个目录到还有一个目录的时候cp ./res /usr 的时候出现了问题,提示我的是: cp略过了目录 后来我找了一下 在网上search了一下CP命令的使用方法: CP命令 该命令的功能是 ...
- 远程视频监控之应用篇(mjpg-streamer)
这篇文章将主要结合源码介绍mjpg-streamer,使小伙伴们了解视频监控的实现. 一.移植 tar xvf mjpg-streamer-r63.tar.gz cd mjpg-streamer-r6 ...
- STM32串口的设置和库函数的介绍
串口设置的一般步骤可以总结为如下几个: 1) 串口时钟使能, GPIO时钟使能 2) 串口复位 3)GPIO 端口模式设置 4) 串口参数初始化 5) 开启中断并且初始化 NVIC(如果需要开启中 ...
- graphic rendering pipeline
整理下管线 此时一定要有这张图 注意表中的数据流向 强调几个细节 之前对次序理解有点乱 rasterizer之前 管线里是只有逐顶点信息的 IA里面会setup primitive 通过Primit ...
- 树行控件TreeView 在WinForm下 怎么实现重命名功能
public Form1() { InitializeComponent(); this.Load+=new EventHandler(Form1_Load); treeVie ...
- Decorator Wrapper 装饰模式 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- scala 学习笔记八 简洁性
Scala可以简洁地表示概念,有时甚至可以说过于简洁. 1.消除中间结果 在组合表达式中,最后一个表达式会变成整个表达式的结果.下面的例子中,值会被捕获到val result中,然后result从方法 ...
- 为什么好多人说win8不好用?
2012年8月就開始接触win8了,那时win8已经出来半年了:自从用了win8之后就感觉他比xp.win7桌面更绚丽.我就喜欢绚丽的桌面.至今使用win8已经两年了,可发现身边好多人都说win8不好 ...
- 【树莓派】制作树莓派所使用的img镜像(一)
最近一直在折腾树莓派,前几天装了10台设备,最近又来了15台开发板子.基本每台设备都需要进行如下操作: 1.安装树莓派OS,并配置键盘.时区.语言编码格式等: 2.新增组.用户.配置静态IP地址: 3 ...