DNA序列编码中Hairpin的定义和计算

觉得有用的话,欢迎一起讨论相互学习~Follow Me

参考文献
[1] 张凯. DNA计算核酸编码优化及算法设计[D]. 2008.
[2] Shin, Soo Yong , et al. "Multiobjective evolutionary optimization of DNA sequences for reliable DNA computing." IEEE Transactions on Evolutionary Computation 9.2(2005):143-158.
[3] Shin, Soo Yong , I. H. Lee , and B. T. Zhang . "Evolutionary Multi-Objective Optimization for DNA Sequence Design." (2008).
[4] Shin, Soo Yong , et al. "Evolutionary sequence generation for reliable DNA computing." Congress on Evolutionary Computation IEEE, 2002.
[5] 饶泽书. 基于多目标粒子群的DNA编码算法研究[D]. 2018.

发卡结构约束

[ * ]定义

单链 DNA 分子产生二级结构通常由自身反向折叠而形成,发卡结构为典型的自身折叠结构.许多以特异性杂交反应为基础的 DNA 计算模型,都要求避免单链 DNA 形成二级
结构,这样单链 DNA 分子才能和自身的补链充分有效的发生特异性杂交[1]。

\[Hairpin( x ) = \sum _ { s = S _ { \mathrm { min } } } ^ { \left( l - R _ { \mathrm { min } } \right) / 2 } \sum _ { r = R _ { \mathrm { min } } } ^ { l - 2 s } \sum _ { i = 1 } ^ { l - 2 s - r } T \left( \sum _ { j = 1 } ^ { s } b p \left( x _ { s + i - j} , x _ { s + i + r + j-1} \right) , \frac { s } { 2 } \right)\]

式中s为茎长,Smin为设定的最小茎长。r为环长，Rmin为设定的最小环长,L表示DNA序列长度。在本文中，设置Smin=6，Rmin=6
T表示阈值函数,T(x,y),只有在x>y时T(x,y)=x;否则T(x,y)=0，此处表示只有连续匹配达到了当前茎区数量的1/2(即>$\frac{S}{2}$)才能算作为茎区的结构。
bp(x,y)函数表示DNA序列中x和y位置的碱基相互互补的个数，如果相互互补即为1，否则记为0.
s表示遍历茎区可能长度，其中 茎区最小长度为人为设定的Smin ，而 茎区最大长度是当环区长度取得最小值Rmin时的茎区长度(l-Rmin)/2
r表示遍历环区可能长度，其中 环区最小长度为人为设定的Rmin ，而 **环区最大长度是当茎区长度取得最小值Smin时的环区长度l-2*Smin**
i表示DNA序列起始处的索引，其中i最小从1处开始,最大可以到l-2s-r处，其中s和r皆为前两步中确定的值。

不同文章中发卡结构约束的定义及区别

上一章中定义此处标记为 [*]定义 而与其他定义相区别，其他定义则根据其引用的参考文献进行标记,即若此处定义出自于参考文献[1],则将其标记为 [1]定义

[2]定义
这个pinlen(p,r,i)很奇怪，定义为当假结中心在(p+i+r/2)时,可能的最大的茎区配对可能数 , 在作者2008发表的文章[3]中指出pinlen即为当前假定
的茎区数。
==但是$x_{p+i+j}和x_{p+i+r+j}的位置并不是假结茎区中一一对应的,[ * ]定义中是一一对应的关系$==

[3]定义
在S.Y.Shin于2008年发表的[3]文章中，提出了如下定义:
==[3] 定义与 [ * ]定义差别在于 [3] 定义中茎区匹配索引比 [ * ] 中均索引大1.==

[4]定义
在S.Y.Shin于2002年发表的[4]文章中，提出了如下定义:
其中Hairpin(x,c)函数没有明确的数学定义。仅仅是给出一个概念。

[5]定义
\[\operatorname { Hairpin } ( x ) = \sum _ { s = S _ { \min } } ^ { \left( l - R _ { \mathrm { min } } \right) / 2 } \sum _ { r = R _ { \min } } ^ { l - 2 s } \sum _ { i = 1 } ^ { l - 2 s - r } T \left( \sum _ { j = 1 } ^ { s } b p \left( x _ { s + i - j } , x _ { s + i + r + j } \right) , \frac { S } { 2 } \right)\]
与[ * ]的区别在于$x _ { s + i - j } , x _ { s + i + r + j }[5],x _ { s + i - j } , x _ { s + i + r + j-1 }[ * ]$

分析与比较

可以看出[ * ]中Hairpin的计算公式较为正确

No	J index	Expression x	Expression y
==*==	-	$x _ { s + i - j}$	$x _ { s + i + r + j-1}$
-	j=1	$x_{s+i-1}$	$x_{s+i+r}$
-	j=s	$x _ {i}$	$x _ { i + r + 2s-1}$
2	-	$x_{s+i+j}$	$x_{s+i+r+j}$
-	j=1	$x_{s+i+1}$	$x_{s+i+r+1}$
-	j=s	$x_{i+2s}$	$x_{i+r+2s}$
3	-	$x _ { s + i - j+1}$	$x _ { s + i + r + j}$
-	j=1	$x_{s+i}$	$x_{s+i+r+1}$
-	j=s	$x _ {i+1}$	$x _ { i + r + 2s}$
5	-	$x _ { s + i - j}$	$x _ { s + i + r + j}$
-	j=1	$x_{s+i-1}$	$x_{s+i+r=1}$
-	j=s	$x _ {i}$	$x _ { i + r + 2s}$

DNA序列编码中Hairpin的定义和计算的更多相关文章

在博客文章中使用mermaid 定义流程图，序列图，甘特图
概述 Mermaid(美人鱼)是一套markdown语法规范,用来在markdown文档中定义图形,包括流程图.序列图.甘特图等等. 它的官方网站是 https://mermaid-js.github ...
[LeetCode] Repeated DNA Sequences 求重复的DNA序列
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
华为OJ平台——DNA序列
题目描述: 一个DNA序列由A/C/G/T四个字母的排列组合组成.G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度).在基因工程中,这个比例非 ...
DNA序列对齐问题
问题描述: 该问题在算法导论中引申自求解两个DNA序列相似度的问题. 可以从很多角度定义两个DNA序列的相似度,其中有一种定义方法就是通过序列对齐的方式来定义其相似度. 给定两个DNA序列A和B,对齐 ...
[DeeplearningAI笔记]序列模型1.1-1.2序列模型及其数学符号定义
5.1循环序列模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.1什么是序列模型在进行语音识别时,给定了一个输入音频片段X,并要求输出片段对应的文字记录Y,这个例子中的输入和输出都输 ...
python实现DNA序列字符串转换，互补链，反向链，反向互补链
在生物信息学分析中,经常对DNA序列进行一系列操作,包括子序列截取,互补序列获取,反向序列获取,反向互补序列获取.在python语言中,可编写如下函数完成这些简单功能. 子序列截取 python中对序 ...
Leetcode 187.重复的DNA序列
重复的DNA序列所有 DNA 由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:"ACGAATTCCG".在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮 ...
[LeetCode] 187. Repeated DNA Sequences 求重复的DNA序列
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
利用Python【Orange】结合DNA序列进行人种预测
http://blog.csdn.net/jj12345jj198999/article/details/8951120 coursera上 web intelligence and big data ...

随机推荐

微信小程序之缓存——不同页面传递数据
1. 添加缓存单个密钥允许存储的最大数据长度为1MB,所有数据存储上限为10MB. // 存储信息到storage // 异步存储 set() { wx.setStorage({ key: 'use ...
winform 保存文件打开文件选择文件字体样式颜色（流 using System.IO;）
string filePath = ""; private void 保存SToolStripMenuItem_Click(object sender, EventArgs e) ...
Svn 提示错误：previous operation has not finished 解决方案
svn提交遇到恶心的问题,可能是因为上次cleanup中断后,进入死循环了. 解决方案: 找到你项目的.svn文件,查看是否存在wc.db 网上下载SQLite Expert工具,手动打开wc.db, ...
关于T/G/M/K
//扫盲贴 K, G, T,都是表数量,只是个数字,在不同的场合下表示的不同.在计算机行业中,这几个量可用来表示数据传输速度和容量,下面分别讨论,希望不了解的朋友不要被某知道上的误解了.如果有什么错误 ...
Linux下C语言编程基础学习记录
VIM的基本使用 LINUX下C语言编程用gcc命令编译运行C语言文件预处理阶段:将*.c文件转化为*.i预处理过的C程序. 编译阶段:将*.i文件编译为汇编代码*.s文件. 汇编阶段:将*.s ...
使用VS2013进行C#程序的单元测试
没有按照预期的那样做出成功的单元测试,磕磕绊绊参照了下面两篇博客大致做出来了,所以很有必要记录一下过程. http://www.cnblogs.com/duasonir/p/5299732.html( ...
style和getComputedStyle（ff）和currentStyle
obj.style:这个方法只能JS只能获取写在html标签中的写在style属性中的值(style=”…”),而无法获取定义在<style type="text/css"& ...
python自动化之PDF
###################################处理PDF和Word文档################################### ''' PDF和Word文档是二进 ...
Courses HDU - 1083 （二分匹配模板题）
Consider a group of N students and P courses. Each student visits zero, one or more than one courses ...
MT【111】画图估计
评:此类方程是超越方程,一般情况下无法解出具体的解,常见手段:1.画图 2.猜根.此处可以取特殊值a=2.5,b=3.5,容易知道此时$x=2.5\in(2,3)$

No	J index	Expression x	Expression y
==*==	-	\(x _ { s + i - j}\)	\(x _ { s + i + r + j-1}\)
-	j=1	\(x_{s+i-1}\)	\(x_{s+i+r}\)
-	j=s	\(x _ {i}\)	\(x _ { i + r + 2s-1}\)
2	-	\(x_{s+i+j}\)	\(x_{s+i+r+j}\)
-	j=1	\(x_{s+i+1}\)	\(x_{s+i+r+1}\)
-	j=s	\(x_{i+2s}\)	\(x_{i+r+2s}\)
3	-	\(x _ { s + i - j+1}\)	\(x _ { s + i + r + j}\)
-	j=1	\(x_{s+i}\)	\(x_{s+i+r+1}\)
-	j=s	\(x _ {i+1}\)	\(x _ { i + r + 2s}\)
5	-	\(x _ { s + i - j}\)	\(x _ { s + i + r + j}\)
-	j=1	\(x_{s+i-1}\)	\(x_{s+i+r=1}\)
-	j=s	\(x _ {i}\)	\(x _ { i + r + 2s}\)

DNA序列编码中Hairpin的定义和计算

DNA序列编码中Hairpin的定义和计算

觉得有用的话,欢迎一起讨论相互学习~Follow Me

发卡结构约束

[ * ]定义

不同文章中发卡结构约束的定义及区别

[2]定义

[3]定义

[4]定义

[5]定义

分析与比较

DNA序列编码中Hairpin的定义和计算的更多相关文章

随机推荐

热门专题