化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|
化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|
生命组学
对Protein的分析可以从Sequence到structure到function,最后研究interaction。
Structure:
化学键形成骨架,化学元素的选取基于合成蛋白质选择容易获取的元素,氨基酸化学元素的选取决定了其结构,其结构又决定了function。氨基酸的组织结构可以解释其function:甘氨酸最小,所以可以放到不同位置;谷氨酸顺反式都有,所以便于结构调整;半胱胺酸因有二硫键而连接紧密。
蛋白质有four levels:一级结构由共价键连接,sequence与结构一一对应。二级结构由氢键连接,基本单位motif与不同环境组合具有不同功能,即功能暗示。三级结构由疏水相互作用控制,基本单位是domain(motif与domain区别在于:motif蛋白质暗示是依据周围氨基酸暗示不同功能,而domain具有独立性)。四级结构是复合结构。除此之外,相互作用力还有离子键和范德华力。
研究protein结构是为了更好研究、制药。Protein Prediction的主要思路是预测亚模块然后预测总体,这其中要联系亚模块之间的相互结构和角度。原始方法采用X-ray,物理上很难实现,所以采用信息学方法省时省力。信息学方法主要是利用类似PDB的Database。所以,信息学方法也可以作为X-ray未能及部分的补充。
二维结构预测:二维结构比三维结构难,这是因为motif 蛋白质暗示依据周围氨基酸暗示不同功能而domain具有独立性。预测方法有以下三种思路:1.因为sequence 相似导致structure相似。所以可以在数据库中寻找相似sequence后copy其结构,但是寻找sequence相似的难度较大。2.clustering analysis:采用机器学习方法,利用已知sequence与结构相对应的数据集作为training集学习,从而预测未知sequence对应结构。3.Chou and Fasman利用氨基酸对应二级结构(二级结构包括螺旋、折叠和转角)中存在概率来预测,但是存在motif问题,即不知道周围环境情况所以无法正确预测,所以采用GOR method。GOR method即以每一个氨基酸将周围17个氨基酸为一组实行数据学习。但是相同序列存在空间结构不同的问题,所以采用PHD方法,即原始数据比较得到profile,再neural network一遍又一遍training,最后用数字置信度判别结果,之后诞生相似原理的Psi-BLAST和PSIPRED,其中PSIPRED准确性最好。
三级结构预测:1.因为三级结构结构比序列更保守,所以可以采用sequence-structure相似性。2.穿线法:先预测sub-structure(二级结构)后assembly,但sub之间位置结构不确定。此情况下可以列出sub的全部组合,基于结合自由能公式建立打分函数进行choose,最后使预测结构与已知结构的误差值评价其精确率3.从头预测方法是first-principle ab initio folding基于energy function找global minimum,在能量最低时停止。原先以原子为基本单位,所以时间长也不精确,之后使用AA为基本单位。此方法适合100个AA或者重要AA。最后,综合使用三类思路,最后预测结果判别时应注意:序列相似性的前提是不同序列长度,长序列比短序列保守,短序列容易出错,需要使用合适模板结构,实际上大部分采用25%-40%的相似度。
化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|的更多相关文章
- dp水题 序列问题 (9道)
9道题.A了8道,A题看题解也没弄懂怎么维护m段子序列的,过一段时间再回来看看 dp试水 47:56:23 125:00:00 Overview Problem Status Rank ( ...
- 重新发现MATLAB
现场编辑 创建不仅捕获代码的脚本 - 它们讲述了可以与他人共享的故事.自动化的上下文提示可让您在编程时快速移动,并将结果和可视化与代码一起显示. 学到更多 访问MATLAB实时脚本库 ...
- MIT molecular Biology 笔记10 翻译
视频 https://www.bilibili.com/video/av7973580/ 教材 Molecular biology of the gene 7th edition J.D. Wat ...
- MIT Molecular Biology 笔记6 转录的调控
视频 https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...
- MIT Molecular Biology 笔记1 DNA的复制,染色体组装
视频 https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...
- Docking非原生配体
转载于 https://mp.weixin.qq.com/s/VDN1qAZGIMol6prwQW4umw Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原 ...
- 用PyMOL展示配体和受体相互作用的原子和氢键
转载于 https://mp.weixin.qq.com/s/P62sjqhSTxmWVicrEAk-RQ 为了简化展示过程,我们设计了一个pml脚本 (脚本内有很详细的解释),只需要修改脚本里面受体 ...
- J15W-J45W全铜截止阀厂家,J15W-J45W全铜截止阀价格 - 专题栏目 - 无极资讯网
无极资讯网 首页 最新资讯 最新图集 最新标签 搜索 J15W-J45W全铜截止阀 无极资讯网精心为您挑选了(J15W-J45W全铜截止阀)信息,其中包含了(J15W-J45W全铜截止阀)厂家,( ...
- J15W-J45W铜质截止阀厂家,J15W-J45W铜质截止阀价格 - 专题栏目 - 无极资讯网
无极资讯网 首页 最新资讯 最新图集 最新标签 搜索 J15W-J45W铜质截止阀 无极资讯网精心为您挑选了(J15W-J45W铜质截止阀)信息,其中包含了(J15W-J45W铜质截止阀)厂家,( ...
随机推荐
- 美团:WSDM Cup 2019自然语言推理任务获奖解题思路
WSDM(Web Search and Data Mining,读音为Wisdom)是业界公认的高质量学术会议,注重前沿技术在工业界的落地应用,与SIGIR一起被称为信息检索领域的Top2. 刚刚在墨 ...
- Facebook的Libra “区块链”到底是如何运作的?
本文深入研究了"关于Facebook Libra coin (以及更多)平台协议"的26页技术文档,并对其内容进行了分解说明.同时,我们对这53位作者表示衷心的钦佩! 以下为具体分 ...
- mybatis-关于<update>的日常记录
!注意:,一定要有 <update id="updateByPrimaryKeySelective" parameterType="com.dhht.model.o ...
- Ivory Coast Map
Fun Facts about Cote d'Ivoire The Republic of Cote d'Ivoire (previously known as the Ivory Coast) is ...
- look and say 外观数列的python实现
#look_and_say 外观数列 如果我们把 1 作为Look-and-say 数列的第一项,那么,它的前几项是这样的: 1, 11, 21, 1211, 111221, 312211, 1311 ...
- mysql按月分表, 组合查询
每个月月底最后一天建好下个月的空表 或每年底建1到12月的空表 , table_201901,table_201902,table_201903 增加记录不需要修改,insert到当月对应表就好了. ...
- RL78 RAM GUARD Funtion
1.段设置 在Section段增加 My_ProtectRAM_n段, 段地址为RAM起始地址+256字节 2.变量定义 #pragma section bss My_ProtectRAM/*My_P ...
- [Algo] 397. Right Shift By N Characters
Right shift a given string by n characters. Assumptions The given string is not null. n >= 0. Exa ...
- 吴裕雄--天生自然 pythonTensorFlow自然语言处理:Seq2Seq模型--训练
import tensorflow as tf # 1.参数设置. # 假设输入数据已经用9.2.1小节中的方法转换成了单词编号的格式. SRC_TRAIN_DATA = "F:\\Tens ...
- Python语言学习前提:循环语句
一.循环语句 1.循环语句:允许执行下一个语句或语句组多次 2. 循环类型 3. 循环控制语句 4. while 循环语句 a.while循环语句:在某个条件下,循环执行某段程序,以处理需要重复处理的 ...