化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|

生命组学

对Protein的分析可以从Sequence到structure到function,最后研究interaction。

Structure:

化学键形成骨架,化学元素的选取基于合成蛋白质选择容易获取的元素,氨基酸化学元素的选取决定了其结构,其结构又决定了function。氨基酸的组织结构可以解释其function:甘氨酸最小,所以可以放到不同位置;谷氨酸顺反式都有,所以便于结构调整;半胱胺酸因有二硫键而连接紧密。

蛋白质有four levels:一级结构由共价键连接,sequence与结构一一对应。二级结构由氢键连接,基本单位motif与不同环境组合具有不同功能,即功能暗示。三级结构由疏水相互作用控制,基本单位是domain(motif与domain区别在于:motif蛋白质暗示是依据周围氨基酸暗示不同功能,而domain具有独立性)。四级结构是复合结构。除此之外,相互作用力还有离子键和范德华力。

研究protein结构是为了更好研究、制药。Protein Prediction的主要思路是预测亚模块然后预测总体,这其中要联系亚模块之间的相互结构和角度。原始方法采用X-ray,物理上很难实现,所以采用信息学方法省时省力。信息学方法主要是利用类似PDB的Database。所以,信息学方法也可以作为X-ray未能及部分的补充。

二维结构预测:二维结构比三维结构难,这是因为motif 蛋白质暗示依据周围氨基酸暗示不同功能而domain具有独立性。预测方法有以下三种思路:1.因为sequence 相似导致structure相似。所以可以在数据库中寻找相似sequence后copy其结构,但是寻找sequence相似的难度较大。2.clustering analysis:采用机器学习方法,利用已知sequence与结构相对应的数据集作为training集学习,从而预测未知sequence对应结构。3.Chou and Fasman利用氨基酸对应二级结构(二级结构包括螺旋、折叠和转角)中存在概率来预测,但是存在motif问题,即不知道周围环境情况所以无法正确预测,所以采用GOR method。GOR method即以每一个氨基酸将周围17个氨基酸为一组实行数据学习。但是相同序列存在空间结构不同的问题,所以采用PHD方法,即原始数据比较得到profile,再neural network一遍又一遍training,最后用数字置信度判别结果,之后诞生相似原理的Psi-BLAST和PSIPRED,其中PSIPRED准确性最好。

三级结构预测:1.因为三级结构结构比序列更保守,所以可以采用sequence-structure相似性。2.穿线法:先预测sub-structure(二级结构)后assembly,但sub之间位置结构不确定。此情况下可以列出sub的全部组合,基于结合自由能公式建立打分函数进行choose,最后使预测结构与已知结构的误差值评价其精确率3.从头预测方法是first-principle ab initio folding基于energy function找global minimum,在能量最低时停止。原先以原子为基本单位,所以时间长也不精确,之后使用AA为基本单位。此方法适合100个AA或者重要AA。最后,综合使用三类思路,最后预测结果判别时应注意:序列相似性的前提是不同序列长度,长序列比短序列保守,短序列容易出错,需要使用合适模板结构,实际上大部分采用25%-40%的相似度。

 

化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|的更多相关文章

  1. dp水题 序列问题 (9道)

    9道题.A了8道,A题看题解也没弄懂怎么维护m段子序列的,过一段时间再回来看看     dp试水 47:56:23 125:00:00   Overview Problem Status Rank ( ...

  2. 重新发现MATLAB

    现场编辑 创建不仅捕获代码的脚本 - 它们讲述了可以与他人共享的故事.自动化的上下文提示可让您在编程时快速移动,并将结果和可视化与代码一起显示. 学到更多 访问MATLAB实时脚本库         ...

  3. MIT molecular Biology 笔记10 翻译

    视频  https://www.bilibili.com/video/av7973580/ 教材 Molecular biology of the gene 7th edition  J.D. Wat ...

  4. MIT Molecular Biology 笔记6 转录的调控

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  5. MIT Molecular Biology 笔记1 DNA的复制,染色体组装

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  6. Docking非原生配体

    转载于 https://mp.weixin.qq.com/s/VDN1qAZGIMol6prwQW4umw Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原 ...

  7. 用PyMOL展示配体和受体相互作用的原子和氢键

    转载于 https://mp.weixin.qq.com/s/P62sjqhSTxmWVicrEAk-RQ 为了简化展示过程,我们设计了一个pml脚本 (脚本内有很详细的解释),只需要修改脚本里面受体 ...

  8. J15W-J45W全铜截止阀厂家,J15W-J45W全铜截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W全铜截止阀 无极资讯网精心为您挑选了(J15W-J45W全铜截止阀)信息,其中包含了(J15W-J45W全铜截止阀)厂家,( ...

  9. J15W-J45W铜质截止阀厂家,J15W-J45W铜质截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W铜质截止阀 无极资讯网精心为您挑选了(J15W-J45W铜质截止阀)信息,其中包含了(J15W-J45W铜质截止阀)厂家,( ...

随机推荐

  1. 内存管理之堆heap

    1.什么是堆? 堆(heap)是一种内存管理方式.内存管理对操作系统来说是一件非常复杂的事情,因为首先内存容量很大, 其次就是内存需求在时间和大小块上没有规律(操作系统上运行着几十甚至几百个进程,这些 ...

  2. @Data与@ConfigurationProperties 简化配置属性数据

    参考地址:https://www.cnblogs.com/FraserYu/p/11261916.html   在编写项目代码时,我们要求更灵活的配置,更好的模块化整合.在 Spring Boot 项 ...

  3. jquery 第一节 什么是jQuery

    简单来说,jQuery就是javascript的一个框架,也可以说是javascript的一个库.

  4. idhttp文件的上传和下载

    unit Unit1; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms ...

  5. 201403-1 相反数 Java

    法1:排序后,首尾两个指针 法2:每个数的绝对值如果出现过,flag置为1,如果再次出现,就计数+1 本文采用法1 import java.util.Arrays; import java.util. ...

  6. python导入自定义的库

    一.导入项目文件夹下的模块 1.导入整个模块 import 模块名 2.导入模块的某个函数 from 模块名 import 函数名 示例 untitled是项目文件夹,文件结构如下 ①在a.py导入c ...

  7. ZJNU 1372 - 破解情书

    取模运算在数组内循环解密,否则会MLE /* Written By StelaYuri */ #include<stdio.h> ],cn[]; int main() { int i,j, ...

  8. JVM学习思维导图

  9. eureka学习之二:自我保护机制

    提供者和消费者:消费者通过注册服务名称,找rpc远程地址,调用提供者的接口 Eureka的自我保护机制:

  10. Leetcode——863.二叉树中所有距离为 K 的结点

    给定一个二叉树(具有根结点 root), 一个目标结点 target ,和一个整数值 K . 返回到目标结点 target 距离为 K 的所有结点的值的列表. 答案可以以任何顺序返回. 示例 1: 输 ...