利用Needleman–Wunsch算法进行DNA序列全局比对

生物信息学原理作业第二弹：利用Needleman–Wunsch算法进行DNA序列全局比对。

具体原理：https://en.wikipedia.org/wiki/Needleman%E2%80%93Wunsch_algorithm。

转载请保留出处！

贴上python代码：

 # -*- coding: utf-8 -*-

 """

 Created on Sat Nov 25 18:20:01 2017

 @author: zxzhu

 后需修改：

 1.加命令行参数

 2.给出多种比对结果

 """

 import numpy as np

 import pandas as pd

 sequence1 = 'AACGTACTCA'

 sequence2 = 'TCGTACTCA'

 s1 = ''

 s2 = ''

 gap = -4

 score_matrix = pd.read_excel('score.xlsx')        #score matrix

 best_matrix = np.empty(shape= (len(sequence2)+1,len(sequence1)+1),dtype = int)

 def get_match_score(s1,s2):

     score = score_matrix[s1][s2]

     return score

 for i in range(len(sequence2)+1):

     for j in range(len(sequence1)+1):

         if i == 0:

             best_matrix[i][j] = gap * j

         elif j == 0:

             best_matrix[i][j] = gap *i

         else:

             match = get_match_score(sequence2[i-1],sequence1[j-1])

             gap1_score = best_matrix[i-1][j]+gap

             gap2_score = best_matrix[i][j-1]+gap

             match_score = best_matrix[i-1][j-1]+match

             best_matrix[i][j] = max(gap1_score,gap2_score,match_score)

 print(best_matrix)

 i,j = len(sequence2),len(sequence1)

 while(i>0 or j>0):

     match = get_match_score(sequence2[i-1],sequence1[j-1])

     if i>0 and j>0 and best_matrix[i][j] == best_matrix[i-1][j-1]+match:

         s1 += sequence1[j-1]

         s2 += sequence2[i-1]

         i-=1;j-=1

     elif i>0 and best_matrix[i,j] == best_matrix[i-1,j]+gap:

         s1+='-'

         s2+=sequence2[i-1]

         i-=1

     else:

         s1+=sequence1[j-1]

         s2+='-'

         j-=1

 print(s1[::-1]+'\n'+s2[::-1])

后面会加入命令行。

多种结果这里只取了一种，这个问题有待解决。

如果有其他的方法我会及时添加。

利用Needleman–Wunsch算法进行DNA序列全局比对的更多相关文章

文本比较算法：Needleman/Wunsch算法
本文介绍基于最长公共子序列的文本比较算法——Needleman/Wunsch算法.还是以实例说明:字符串A=kitten,字符串B=sitting那他们的最长公共子序列为ittn(注:最长公共子序列不 ...
字符串与模式匹配算法（六）：Needleman–Wunsch算法
一.Needleman-Wunsch 算法尼德曼-翁施算法(英语:Needleman-Wunsch Algorithm)是基于生物信息学的知识来匹配蛋白序列或者DNA序列的算法.这是将动态算法应用于 ...
文本比较算法Ⅱ——Needleman/Wunsch算法
在"文本比较算法Ⅰ--LD算法"中介绍了基于编辑距离的文本比较算法--LD算法. 本文介绍基于最长公共子串的文本比较算法--Needleman/Wunsch算法. 还是以实例说明: ...
文本比较算法Ⅱ——Needleman/Wunsch算法的C++实现【求最长公共子串（不需要连续）】
算法见:http://www.cnblogs.com/grenet/archive/2010/06/03/1750454.html 求最长公共子串(不需要连续) #include <stdio. ...
牛客算法：DNA序列
import java.util.*; public class Main{ public static void main(String[] args){ try(Scanner in = new ...
DNA序列组装（贪婪算法）
生物信息学原理作业第四弹:DNA序列组装(贪婪算法) 原理:生物信息学(孙啸) 大致思想: 1. 找到权值最大的边: 2. 除去以最大权值边的起始顶点为起始顶点的边: 3. 除去以最大权值边为终点为终 ...
利用Python【Orange】结合DNA序列进行人种预测
http://blog.csdn.net/jj12345jj198999/article/details/8951120 coursera上 web intelligence and big data ...
[LeetCode] Repeated DNA Sequences 求重复的DNA序列
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
简单DNA序列组装（非循环子图）
生物信息学原理作业第四弹:DNA序列组装(非循环子图) 原理:生物信息学(孙啸) 大致思想: 1. 这个算法理解细节理解比较困难,建议看孙啸的生物信息学相关章节. 2. 算法要求所有序列覆盖整个目标D ...

随机推荐

python列表三
>>> list1 = [123]>>> list2 =[234]>>> list1 > list2False>>> li ...
sql server2008数据库复制实现数据同步常见问题
sql server2008数据库复制实现数据同步常见问题在原作者基础上追加 sql server2008数据库复制实现数据同步常见问题 23.发布 'xx' 的并发快照不可用,因为该快照尚未完全生 ...
[学习OpenCV攻略][010][写入AVI文件]
cvSize(文件宽度,文件高度) 通过图片或视频文件的宽高得到尺寸信息,返回值是CvSize cvCreateVideoWriter(输出文件名,编码格式,帧率,图像大小) 通过设置输出视频的格式信 ...
UIScrollerview的contentsize设置
最近被同行的一个朋友问到一个问题"UIScrollerview上添加子控件,给子控件约束好布局之后,还需要给scrollerview重新设置contentsize吗?"于是想到了我 ...
Nginx实战之反向代理WebSocket的配置实例
http://www.jb51.net/article/112183.htm 最近在工作中遇到一个需求,需要使用 nginx 反向代理websocket,经过查找一番资料,目前已经测试通过,所以这篇文 ...
Tp框架查询分页显示与全部查询出来显示运行时间快慢有区别吗？
8:08:01 青春阳光 2017/4/7 8:08:01 大神在吗? Tp框架查询分页显示与全部查询出来显示运行时间快慢有区别吗? 青春阳光 2017/4/7 8:08:20 还有个问题,上传到pu ...
各大型邮箱smtp服务器及端口收集
>新浪邮箱smtp服务器外发服务器:smtp.vip.sina.com 收件服务器:pop3.vip.sina.com 新浪免费邮件外发服务器:smtp.sina.com.cn 收件服务器: ...
ios开发第一天
alloc 分配内存(类方法) init 调用构造函数 id可以替代任何数据类型(不加*号) 错误现象: 2013-06-27 21:44:21.769 FieldButtonFun[3465:113 ...
CSS3总结学习（一）：CSS3用户界面
在CSS3中,新的用户界面属性有很多,本文重点介绍resize,box-sizing,offset. 浏览器支持,如下图,图片源于W3school 1.CSS Resizing 在css3,resiz ...
在CMainFrame里使用定时器是有讲究的
设置定时器函数:SetTimer 单位毫秒销毁定时器函数:KillTimer 消息:WM_TIMER 注意事项: (1)不要在构造函数里设置定时器. (2)不要在析构函数里销毁定时器. 原因:构造函 ...

利用Needleman–Wunsch算法进行DNA序列全局比对

利用Needleman–Wunsch算法进行DNA序列全局比对的更多相关文章

随机推荐

热门专题