生物医学大数据

重点:蛋白质定量

新蛋白可以是全新的蛋白质,也可以是知结构但未知功能的蛋白质,也可以是知道结构有新功能的蛋白质。

新蛋白鉴定可以使用以下方法。

基于基因组,可以基因组中的coding区数据库变成理论上的蛋白质数据库,利用密码子翻译出氨基酸,为准确可以有三种版本,可以敲除1个碱基,2个碱基,3个碱基等,同时考虑正反链因素,就有3*2=6种可能性。基于转录组翻译情况,采用搜索已知蛋白质信息数据库,准确率高。denovo方法,即从头测序的综合比较方法,可信度基于打分值或p-value等,

可以综合使用以上方法。

拿到原始数据后,因为许多蛋白质低峰度的部分不易被MSMR察觉,同时分析时是分时段取样,量更少,更加不易定量,所以将此数据过滤。可以使用pFind进行开放式搜索以先查全后查准的原则,为了缩小大误差而搜库,为了缩小小误差而过滤。

蛋白质鉴定概率计算是得到的置信度基于数据导向不是研究导向,即没有对单个蛋白做鉴定概率的计算,只有对同一批次数据所做的计算,同时不能直接合并不同数据处理后的数据。这也是多批次质控需要注意的内容。多搜索引擎使用2个引擎最佳,组合模式是mascot+X。

蛋白质翻译后会进行修饰。关于修饰的的现状是低谱图鉴定率,即蛋白质修饰没鉴定到,因此这些无法识别的修饰使得蛋白表达量被低估。修饰分为体内修饰、体外修饰和氨基酸突变,体内修饰是自然情况,翻译后修饰,大部分修饰是体内修饰。体外修饰是人为修饰,在实验研究中使用。氨基酸突变是通过氨基酸磷酸化扩大蛋白质种类。

具体而言,磷酸化有10^4 or 10^5种,泛素化可规模化鉴定,糖基化比较复杂,难以鉴定。

修饰鉴定原理是将正常和修饰两种谱图比对,y值变大则证明修饰存在。鉴定困难在于修饰种类多,修饰量少低丰度难察觉,修饰往往在动态变化,比如磷酸化的种类是发生或不发生^位点数。修饰研究的内容,有以下四个方面,包括修饰鉴定,修饰定量,修饰作用网络,新修饰的鉴定。

常规修饰鉴定流程用于对已存在的修饰进行鉴定:

首先指定修饰类型,修饰类型包括固定修饰和可变修饰,固定修饰是某位点100%发生修饰,可变修饰是某位点不一定发生修饰。通过数据库搜索,找到该修饰的修饰类型、修饰肽段和修饰位点。在质控时,对于体外修饰可以直接肽段质检;对于体内修饰,高丰度蛋白可以将修饰与非修饰分开再肽段质检,对于低丰度蛋白先卡质量值后肽段质检。肽段质控后进行位点质控,eg:phosphors软件可针对磷酸化修饰的鉴定。

探索新修饰可采用非限制性修饰鉴定:

虽然不指定修饰类型,但规定修饰质量范围,通过与数据库中存在修饰信息进行序列比对或图谱比对,找到修饰类型和修饰位点,最后质控。

可以综合使用以上两种方法,取少样本加入不指定修饰类型,然后得到修饰类型,根据得到的修饰类型加入到常规修饰鉴定的流程中去,从而指定修饰类型。常用软件有mascot。

虽然可变修饰多使得搜库的灵敏度下降,但是首先保证准确度。可使用多批次搜库策略,即每次一种修饰作为一次搜寻,有n种修饰则并行n次搜寻,而不是N种修饰同时搜寻。

修饰鉴定与生物学过程,通过测得代谢途径中的所有物质的修饰来解释生物学过程。

蛋白质修饰|phosphors|mascot+X|的更多相关文章

  1. PEAKS|NovoHMM|Nover|DeepNovo|MAYUPercolator|UniprotKB|Swiss-prot|Mascot|SEQUEST|X!Tandem|pFind|MaxQuant|Msconvert|PEPMASS|LC|

    质谱仪: 质谱分析法是先将大分子电离为带电粒子,按质核比分离,由质谱仪识别电信号得到质谱图. Top-down直接得到结果是蛋白. Bottom down使用shutgun方法得到结果是肽段. 由蛋白 ...

  2. 【3】蛋白鉴定软件之Mascot

    目录 1.简介 2.配置 2.1在线版本 2.2 服务器版本 3.运行 3.1 在线版本 3.2 服务器版本 4.结果 1.简介 Mascot是非常经典的蛋白鉴定软件,被Frost & Sul ...

  3. The Practical Guide to Empathy Maps: 10-Minute User Personas

    That’s where the empathy map comes in. When created correctly, empathy maps serve as the perfect lea ...

  4. 微信OAuth2.0网页授权

    1.OAuth2.0网页授权 关于网页授权的两种scope的区别说明 1.以snsapi_base为scope发起的网页授权,是用来获取进入页面的用户的openid的,并且是静默授权并自动跳转到回调页 ...

  5. .NET微信开发通过Access Token和OpenID获取用户信息

    本文介绍如何获得微信公众平台关注用户的基本信息,包括昵称.头像.性别.国家.省份.城市.语言. 本文的方法将囊括订阅号和服务号以及自定义菜单各种场景,无论是否有高级接口权限,都有办法来获得用户基本信息 ...

  6. 微信公众平台开发(71)OAuth2.0网页授权

    微信公众平台开发 OAuth2.0网页授权认证 网页授权获取用户基本信息 作者:方倍工作室 微信公众平台最近新推出微信认证,认证后可以获得高级接口权限,其中一个是OAuth2.0网页授权,很多朋友在使 ...

  7. Java vs. C#

    Java Program Structure C# package hello; public class HelloWorld {    public static void main(String ...

  8. VB.NET vs. C#

    VB.NET Program Structure C# Imports System Namespace Hello    Class HelloWorld        Overloads Shar ...

  9. Chinese culture

      文房四宝 笔墨纸砚是中国古代文人书房中必备的宝贝,被称为“文房四宝”.用笔墨书写绘画在 中国可追溯到五千年前.秦(前221---前206)时已用不同硬度的毛和竹管制笔:汉代(前206—公元220) ...

随机推荐

  1. Java目录下文件夹的含义和运行机制

    Java安装目录下的各个文件夹的意义 >bin 放置Java所有的可执行文件 >include 一些C语言的头文件 >jre Java的运行环境 >lib Java的类库文件 ...

  2. ArrayList集合存储VO封装对象后调用的问题

    VO代码: public class VO4Blog { private int b_id; private int b_typeid; private String b_title; private ...

  3. dfs--八皇后问题

    在N*N的方格棋盘放置了N个皇后,使得它们不相互攻击(即任意2个皇后不允许处在同一排,同一列,也不允许处在与棋盘边框成45角的斜线上. 你的任务是,对于给定的N,求出有多少种合法的放置方法. 因为我们 ...

  4. Redis5新特性Streams作消息队列

    前言 Redis 5 新特性中,Streams 数据结构的引入,可以说它是在本次迭代中最大特性.它使本次 5.x 版本迭代中,Redis 作为消息队列使用时,得到更完善,更强大的原生支持,其中尤为明显 ...

  5. UML-操作契约总结

    1.操作契约属于什么? 属于用例模型 如图: 2.操作契约在那个阶段引入? 在细化阶段,并非初始阶段. 3.哪些需要写操作契约? 1).最复杂的系统操作 2).最微妙的系统操作

  6. Linux-编写简单守护进程

    1.任何一个进程都可以将自己实现成一个守护进程 2.create_daemon函数要素 (1).子进程要等待父进程退出 (2).子进程使用setsid创建新的会话期,脱离控制台 (3).调用chdir ...

  7. 884A. Book Reading#抽空学习好孩子(模拟)

    题目出处:http://codeforces.com/problemset/problem/884/A 题目大意:每天时间分两部分,工作和学习,工作优先,闲暇读书,问第几天读完 #include< ...

  8. 巧用函数,使Sql中in的用法更多变

    在Sql中我们经常会用到in 普遍的写法为 where xx in ('1','2','3') 通过函数写法为: IF EXISTS ( SELECT * FROM sys.objects WHERE ...

  9. scp 碰到的问题

    将 nodejs 的全局目录scp复制到另外一台机器部署代码, 发现运行报错, 提示缺少依赖模块. 检查了很久, 没发现问题. 后来发现,软链接 scp后不再是软链接而是对应文件, 导致相对路径改变!

  10. 吴裕雄--天生自然 pythonTensorFlow图形数据处理:数据集基本使用方法

    import tempfile import tensorflow as tf # 1. 从数组创建数据集. input_data = [1, 2, 3, 5, 8] dataset = tf.dat ...