4、在线blast比对结果解析(保守结构域)
转载:http://www.bio1000.com/experiment/fenzi/237846.html
ncbi blast比对结果报告分析:BLAST是NCBI开发的一款序列相似搜索程,常用在线的BLAST比对工具进行序列比对分析和引物设计。
写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。
本文以BLASTP为例子,详细说明如何来解读最新的BLAST结果报告。
示例
BLAST地址:
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=
blastp&page_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome
比对用的例子:
>gi|16758036|ref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus]
MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQH
AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKendQKKKEAKEKGTWVQLNGQPAPPREAHF
VRTNGKEPELLEPIPYEFMA
数据选择:nr
比对时间:2009年9月9日12:46:23
解读报告前需要掌握的概念
alignments 代表比对上的两个序列
hits 表示两个序列比对上的片段
Score 比对得分,如果序列匹配上得分不一样,减分,分值越高,两个序列相似性越高
E Value 值越小,越可信,相对的一个统计值。
Length 输入序列的长度
Identities 一致性,就是两个序列有多少是一样的
Query 代表输入序列
Subjct 代表数据库中的序列
结果详细说明
菜单与基本信息

NCBI Blast结果-菜单与基本信息
1.下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;
2.此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI会自动生成一个;
3.你输入序列的信息,包括标识号、描述信息、类型、长度;
4.数据库的信息以及你选择的Blast程序;
5.查看其他报告,比如摘要、分类、距离树、结构、多重比对等。
Graphic Summary

Graphic Summary
1.保守域,Blastp时,如果与保守域数据库比对有结果时,方显示; #######https://www.ncbi.nlm.nih.gov/cdd 1、CD-SearchBatch 2、CD-Search
2.Distribution of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;
3.这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;
4.颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果;
5.输入序列的坐标;
6.每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。
深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。
Descriptions

Descriptions
1.比对上序列的标识符,上面有到该序列详细信息的链接;
2.序列的表述信息,可以知道这个序列功能、基因、物种等信息;
3.比对得分,由高向低排列,上面有到比对详细信息的链接;
4.E value,由低向高排列;
5.该序列的其他链接,字母表示数据库,比如U表示unigene、G表示Gene数据库;
深入解读:简要的列表形式,便于阅读都比对上了哪些序列,(如果你经验丰富,从score的得分就大致可以判断序列的相似性)序列的相似情况。
Alignments

Alignments 比对详细信息
1.比对上的序列信息;
2.比对的各种得分,这里不做一一说明,这里我最关注的是Identities,比对上(一致)的数字、一共有多少个,比对上所占的比例。
3.具体的比对序列显示,一目了然,知道了哪些序列比对上了,哪些序列是不一样的,这里也要注意序列的位置关系;
5.复选框,可以选择感兴趣的比对序列,在⑥处进行相应的操作;
6.对选择的序列进行操作,比如下载这些序列、画系统发育树、进行多重比对。
深入解读:blast是以hit为单位显示的结果,分段比对是其核心,所以对于每个hit所显示的信息应当有个深入的理解。至于比对上的情况如何,不要迷信于那些数字,通过序列,你一眼就可以看出来。最后就是注意5、6的操作,可以给你带来很大的便利。
温馨提示:新手可以把Blast工具中的英文概念弄清楚,完全理解后才能事倍功半。此外,也可根据在blast中查找的目的不同做不同的操作,例如:可以把比对序列做多重比对
4、在线blast比对结果解析(保守结构域)的更多相关文章
- (转)mysql原生在线ddl和pt-osc原理解析
原文:http://blog.csdn.net/zengxuewen2045/article/details/52017247 https://github.com/mysql-inception/i ...
- blast | diamond 输出结果选择和解析 | 比对
之前的文章:构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb 本地运行blast时,需要指定out fo ...
- (五)WebGIS中通过行列号来换算出多种瓦片的URL 之在线地图
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.前言 这篇文章里,我主要针对OGC标准中的WMS.WMTS以及Ar ...
- c# jobject 的数据结构的解析:
c# jobject 数据结构的解析:首先下载Newtonsoft.Json,增加引用using Newtonsoft.Json.Linq;把jobject的内容提取出来,Jobject的内容格式如下 ...
- blast 数据库说明
Peptide Sequence Databases蛋白序列的数据库 nrAll non-redundant GenBank CDS translations + RefSeq Proteins + ...
- 从底层谈WebGIS 原理设计与实现(五):WebGIS中通过行列号来换算出多种瓦片的URL 之在线地图
从底层谈WebGIS 原理设计与实现(五):WebGIS中通过行列号来换算出多种瓦片的URL 之在线地图 作者:naaoveGI… 文章来源:naaoveGIS 点击数:2063 更 ...
- [b0023] python 归纳 (九)_html解析-lxml
# -*- coding: utf-8 -*- """ 学习lxml解析网页 程序功能: 解析 360影视 电影排行榜中的信息 https://www.360kan.co ...
- 生物数据库介绍——NCBI
NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源.NCB ...
- Android语录
1. application对象的生命周期是整个程序中最长的,它的生命周期就等于这个程序的生命周期.因为它是全局的单例的,所以在不同的Activity,Service中获得的对象都是同一个对象.因此在 ...
随机推荐
- [原创]java WEB学习笔记43:jstl 介绍,core库详解:表达式操作,流程控制,迭代操作,url操作
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- 【leetcode刷题笔记】Best Time to Buy and Sell Stock II
Say you have an array for which the ith element is the price of a given stock on day i. Design an al ...
- autoplay移动端不能自动播放
本文总结自:https://stackoverflow.com/questions/12496144/can-you-autoplay-html5-videos-on-the-ipad 首先,自动播放 ...
- Excel 2007中自定义数字格式前要了解的准则
要在Excel 2007中创建自定义数字格式,首先应了解自定义数字格式的准则,并从选择某一内置数字格式开始.然后,可以更改该格式的任意代码部分,从而创建自己的自定义数字格式. 数字格式最多可包含四个代 ...
- keeplive使用
一.简介 Keepalived是一个免费开源的,用C编写的类似于layer3, 4 & 7交换机制软件,具备我们平时说的第3层.第4层和第7层交换机的功能.主要提供loadbalancing( ...
- windows8.1下安装msi文件报错
新安装了win8.1系统体验体验,可是安装msi文件的软件报internal error2502和2503错误,可以换一种安装方式. 不是直接点开安装,如图所示打开命令提示符: 使用msiexec / ...
- Shiro-权限认证(授权)-编程式授权
权限认证 权限认证也就是访问控制,即在应用中控制谁能访问哪些资源 权限认证核心要素 权限 : 即操作资源的权利,比如访问某个页面,以及对某个模块的数据的添加,修改,删除,查看的权利 角色 : 是权限的 ...
- sqlserver 函数里并返回一个表格数据拼接的字符串
Create function [dbo].[GetChildWorkerExtension]( @ChildId int)returns nvarchar(100)asbegin ...
- unit Base64Unit;
unit Base64Unit; unit Base64Unit; //Download by http://www.codefans.net interface uses Classes, SysU ...
- 51nod1428 活动安排问题 (贪心加暴力)
1428 活动安排问题 基准时间限制:1 秒 空间限制:131072 KB 分值: 10 难度:2级算法题 收藏 关注 有若干个活动,第i个开始时间和结束时间是[Si,fi),同一个教室安排的活动 ...