生命组学

蛋白质之间的互作可以有以下应用:

Eg:改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。

Eg:数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的dataset,用于制药

结构预测:

通用方法:首先将得到序列采用Fasta(全局序列比对)&blast(局部序列比对)在PDB中(此数据库中有实验数据和计算预测得到的数据)找模板modeling。找模板的方法可以基于sequence similarity。可以基于structure相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法quality高。可以基于研究目的(ligands and cofactors)。对于alignment方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确,pair模板序列比对结果具有高相似度,可用于保守区验证。model building方法:1.满足钢铁模型直接把保守区域的copy到给未知序列。2.方法一对于序列要求很高,必有没能连上的部分,没连上部分fragment assembly,这样得到的结构与膜件相似度高3.通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于assembly的software有insight QUANTA和SYBYL COMPOSER,这两个软件是图形界面且收费。也可使用MODELLER编译。在线分析软件有SWISS_MODEL、WHAT IF、3D-JIGSAW、CPH-Model。

普通方法用于水环境,Membrane protein溶液环境。

实验测困难,所以采用bioinformation的方法预测结构,特殊之处在于modeling Membrane protein structure模板是GPCRs(有螺旋),主要预测蛋白质形态,所处位置和胞内胞外结构,再将三者组合成初始结构,然后进一步优化旋转方向。

功能预测基于已解析的功能信息,有以下五种原理:

1.可使用自动化脚本在数据库中找sequence similarity,利用experiment判据选择。

2.因为结构比序列更保守,所以可采用structure-based。利用结构相似性找对应序列,分解出序列特征,通过序列相似性找相似性功能SCOP。其中,不同层级准确性不同:class <fold <superfamily <family

3.可通过预测结合腔的大小、形状、理化性质,从而得到功能域信息,有功能域就有功能

4.以motif-based为基本单位预测,选择可用功能,之后做进化树判断选择近源功能。

5.从System level角度来说,在KEGG pathway找到通路中的功能。

蛋白质之间互作网络便是PPI网络,它有两种类型:1.几种蛋白质参与同一个生物学过程,这是间接互作。2.几种蛋白质组成同一个复合物,这是直接接触而互作(eg:蛋白质复合物;四级结构)共同作用结果是行使功能。

研究互作方法:

  1. Phylogenetic profile method:某些基因经常同时存在,则认为这些基因对应蛋白质互作。
  2. Gene neighborhood:基因相对位置保守,则认为这些蛋白质互作。
  3. 物种A中两个功能域在同一个蛋白上,物种B中转变为两个蛋白质,则认为这两个蛋白质互作。这是因为真核生物中的调控更复杂,需要更多原件,所以有些功能域分化出来,基因组变大。
  4. 基因共进化:因为基因组系统发育树相近所以有可能蛋白质拓扑关系一致(eg1:一个带正电一个带负电。Eg2:金属A与金属B互作,A变则B也变),可以用跨物种比对拓扑关系,比对可用打分矩阵,最后用相关系数来判断,若等于1则说明有互作。

Protein interaction|insight QUANTA|SYBYL COMPOSER|MODELLER|SWISS_MODEL|WHAT IF|3D-JIGSAW|CPH-ModelGPCRs|Membrane protein|的更多相关文章

  1. 用R的igraph包来画蛋白质互作网络图 | PPI | protein protein interaction network | Cytoscape

    igraph语法简单,画图快速. Cytoscape专业,个性定制. 最终效果图: 当然也可以用Cytoscape来画. 参考:Network visualization with R Cytosca ...

  2. 08 Translating RNA into Protein

    Problem The 20 commonly occurring amino acids are abbreviated by using 20 letters from the English a ...

  3. 文献笔记:Genome-wide associations for birth weight and correlations with adult disease

    该文献纳入了EGG(Early Growth Genetics Consortium)和UK biobank两大数据库,分为欧洲祖先和非欧洲祖先群体.这两个数据用到的样本量分别如下: Early Gr ...

  4. 生物数据库介绍——NCBI

    NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源.NCB ...

  5. MGI数据库挖掘 | MGI-Mouse Genome Informatics | InWeb database

    做生物信息,遗传发育,分析数据的时候总是要narrow down分析范围,高通量数据尤其是基因表达,在庞大的confounder面前,缩小分析范围是必须的,否则你会一直在混沌中游荡. 看一篇文章:20 ...

  6. Zn离子参数

    Generating Topology and Coordinates Files Using xLeap (AmberTools V1.5) Parameter and example files: ...

  7. 蛋白质结构模型和功能预测:I-TASSER工具的使用

    I-TASSER是一款用于预测蛋白质结构和功能的工具,网站链接:https://zhanglab.ccmb.med.umich.edu/I-TASSER/ 具体描述如下: I-TASSER (Iter ...

  8. 全球最大的3D数据集公开了!标记好的10800张全景图

    Middlebury数据集 http://vision.middlebury.edu/stereo/data/ KITTI数据集简介与使用 https://blog.csdn.net/solomon1 ...

  9. 构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb

    参考链接: FTP README 如何下载 NCBI NR NT数据库? 下载blast:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 先了解 ...

随机推荐

  1. C语言-数组的深入学习

    深入学习一下数组1.从内存角度来讲:数组变量就是一次分配多个变量,而且这些变量的地址是连续的,也就是存放这些变量的存储单元是依次相连接的.而且这多个变量必须单独访问,不可以一起访问的.因为他们的地址彼 ...

  2. [转载]matlab视频读取函数VideoReader

    看到以前matlab中读取视频多 使用mmreader等(参考<matlab读取/播放视频的函数>),而现在matlab有一个专门的视频读取类VideoReader完成视频读取的功能. 相 ...

  3. usr/sbin/inetd

    root 4 0.0 1344 1204? S 17:09 0:10 /usr/sbin/inetd 运行 Internet 超级 服务器,它负责监听 Internet sockets 上的连接,并调 ...

  4. 《Docekr入门学习篇》——Docker简介

    Docker简介 什么是docker Docker是Docker.inc公司开源的一个基于LXC技术之上构建的Container容器引擎,源代码托管在GitHub上,基于Go语言并遵从Apache2. ...

  5. ActiveMQ消息队列集群的搭建

    1.准备activemq apache-activemq-5.12.0-bin.tar 2.解压文件 3.并将文件cp一份命名为activemq1 进入conf文件进行修改 修改属性为brokerNa ...

  6. gbdt在回归方面的基本原理以及实例并且可以做分类

    对书法的热爱,和编译器打数学公式很艰难,就这样的正例自己学过的东西,明天更新gbdt在分类方面的应用. 结论,如果要用一个常量来预测y,用log(sum(y)/sum(1-y))是一个最佳的选择. 本 ...

  7. MySQL--mysqldump(数据导出工具)

    mysqldump 客户端工具用来备份数据库或在不同数据库之间进行数据迁移.备份内容包含创建表或装载表的 SQL 语句.mysqldump 目前是 MySQL 中最常用的备份工具. 有 3 种方式来调 ...

  8. Apache Commons Lang之日期时间工具类

    码农不识Apache,码尽一生也枉然. FastDateFormat FastDateFormat是一个快速且线程安全的时间操作类,它完全可以替代SimpleDateFromat.因为是线程安全的,所 ...

  9. SAP AM:固定资产采购的预算管理

    对于很多公司来说,购买资产是公司年度支持的主要部分,因此需要用预算管理来防止过度支出.这项支出被列为资本支出,所以很多公司都需要对购买过程和安全防范进行良好的控制.以下文中说明如何在购买资产时使用预算 ...

  10. 吴裕雄--天生自然Linux操作系统:Linux常用命令大全

    系统信息 arch 显示机器的处理器架构 uname -m 显示机器的处理器架构 uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) ...