GFF3格式文件
GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性,分为9列,以TAB分开。
依次是:
1. reference sequence:参照序列
指出注释的对象。如一个染色体,克隆或片段。可以有多个参照序列。
该id的取名不能以’>’开头,不能包含空格。
2. source :来源
注释的来源。如果未知,则用点(.)代替。
3. type :类型
属性的类型。建议使用符合SO惯例的名称(sequence ontology,参看[[Sequence Ontology Project]]) ,如gene,repeat_region,exon,CDS等。
4. start position :起点
属性对应片段的起点。从1开始计数。
5. end position :终点
属性对应片段的终点。一般比起点的数值要大。
6. score :得分
对于一些可以量化的属性,可以在此设置一个数值以表示程度的不同。如果为空,用点(.)代替。
7. strand :链
“+”表示正链,“-”表示负链,“.”表示不需要指定正负链。
8. phase :步进
对于编码蛋白质的CDS来说,本列指定下一个密码子开始的位置。可以是0,1或2,表示到达下一个密码子需要跳过的碱基个数。
对于其它属性,则用点(.)代替。
9. attributes :属性
一个包含众多属性的列表。格式为“标签=值”(tag=value)。不同属性之间以分号相隔。可以存在空格,不过若有“,=;”则用URL转义(URL escaping rule),同时TAB也需要转换为“ ”表示。所有以大写字幕开头的标签被保留,用于大众认可的用途,而以小写字母开头的标签则根据自己安排随意应用。
下列的标签已定义:
ID
指定一个唯一的标识。对属性分类是非常好用(例如查找一个转录单位中所以的外显子)。
Name
指定属性的名称。展示给用户的就是该属性。。Name的值在可视化的时候得到展示。因此,Name可以根据自己展示的需要随意取值。
Alias
名称的代称或其它。当存在其它名称时使用该属性。
Parent
指明feature所从属的上一级ID。用于将exons聚集成transcript,将transripts聚集成gene。
Target
指明比对的目标区域,一般用于表明序列的比对结果。格式为”target_id start end [strand]“,其中strand是可选的(“+”或”-”), target_id中如果包含空格,则要转换成’ ′。
Gap
比对结果的gap信息,和Target一起,用于表明序列的比对结果。
Note
描述性的一些说明。
Is_circular
表明featrue是否为环化的。用于环状基因组序列。
同一个tag如果有多个值,则多个值之间使用逗号隔开,比如:
Parent=AF2312,AB2812,abc-3
Alias=M19211,gna-12,GAMMA-GLOBULIN
能够使用多个值的tag有:Parent, Alias, Note, Dbxref and Ontology_term。
参考:http://blog.sina.com.cn/s/blog_670445240102uxh2.html
GFF3格式文件的更多相关文章
- (转) gffcompare和gffread | gtf | gff3 格式文件的分析 | gtf处理 | gtfparse
		
工具推荐:https://github.com/openvax/gtfparse 真不敢相信,Linux自带的命令会这么强大,从gtf中提取出需要的transcript,看起来复杂,其实一个grep就 ...
 - GFF3格式
		
GFF3是GFF注释文件的新标准.文件中每一行为基因组的一个属性,分为9列,以TAB分开. 依次是: 1. reference sequence:参照序列 指出注释的对象.如一个染色体,克隆或片段.可 ...
 - 【NLP】Tika 文本预处理:抽取各种格式文件内容
		
Tika常见格式文件抽取内容并做预处理 作者 白宁超 2016年3月30日18:57:08 摘要:本文主要针对自然语言处理(NLP)过程中,重要基础部分抽取文本内容的预处理.首先我们要意识到预处理的重 ...
 - Mac新建文件夹、txt文件、无格式文件
		
新建文件夹: mkdir test 新建txt touch test.txt 新建无后缀格式文件 touch test 如果要删除文件夹 rm -r -f test
 - 针对格式文件,Python读取一定大小的文件内容
		
由数据库导出的数据是格式化数据,如下所示,每两个<REC>之间的数据是一个记录的所有字段数据,如<TITLE>.<ABSTRACT>.<SUBJECT_COD ...
 - 报表开发导出各种格式文件的API
		
文件输出的多样性,准确性和稳定性对于我们常用的报表软件来说很重要.报表的输入是指从报表的模板文件(XML格式的)创建WorkBook对象,输出则指将报表保存为各种格式文件,比如Pdf.Excel.Wo ...
 - 2013xlsm格式文件处理
		
2013xlsm格式文件处理 2013格式的xlsm文件在低版本打开为空白的处理 1.关闭2013的宏2.打开文件,另存(去打开密码)3.2007打开另存(格式已变为2007)4.仅破解VBA密码5. ...
 - Servlet 实现上传文件以及同时,写入xml格式文件和上传
		
package com.isoftstone.eply.servlet; import java.io.BufferedReader; import java.io.BufferedWriter; i ...
 - [OSG][转]osg格式文件
		
转自:http://blog.csdn.net/timothyfly/article/details/7826139 osg格式文件中如何处理多个节点共享一个子节点 下面一段程序中,共有三个Group ...
 
随机推荐
- 基于H5的微信支付开发详解
			
这次总结一下用户在微信内打开网页时,可以调用微信支付完成下单功能的模块开发,也就是在微信内的H5页面通过jsApi接口实现支付功能.当然了,微信官网上的微信支付开发文档也讲解的很详细,并且有实现代码可 ...
 - [No0000A9]实用word用法
			
目录 TOC \o "1-3" \h \z \u 三招去掉页眉那条横线.... PAGEREF _Toc465252982 \h 08D0C9EA79F9BACE118C8200 ...
 - Could not load type 'System.Web.Mvc.ViewPage<dynamic>' in asp.net mvc2 after publishing the website
			
在WebConfig里 找到 <pages></pages> <pages pageParserFilterType="System.Web.Mvc.ViewT ...
 - 每天成长一点---WEB前端学习入门笔记
			
WEB前端学习入门笔记 从今天开始,本人就要学习WEB前端了. 经过老师的建议,说到他每天都会记录下来新的知识点,每天都是在围绕着这些问题来度过,很有必要每天抽出半个小时来写一个知识总结,及时对一天工 ...
 - [LeetCode] Regular Expression Matching 正则表达式匹配
			
Implement regular expression matching with support for '.' and '*'. '.' Matches any single character ...
 - Codeforces Round #384(div 2)
			
A 题意:有n个机场处于一直线上,可两两到达,每个机场只可能属于两家公司中的一家(用0,1表示),现在要从a机场到b机场,可任意次转机.若机场i与机场j从属同一公司,则费用为0,否则费用为1.问最小费 ...
 - windows批处理运行java程序
			
明确需求 今天你编了一个java swing版照片查看器,想让计算机上的所有照片默认打开方式都改成你的照片查看器. 使用工具软件 很多工具软件都是不把jre打包到exe中的,这就是说打包之后的exe只 ...
 - php代码基础
			
如何接入新浪api <?php function getWeiboData() { $count = 15; // 参数source后面输入你的授权号 $url = "https:// ...
 - WATERHAMMER: A COMPLEX PHENOMENON WITH A SIMPLE SOLUTION
			
开启阅读模式 WATERHAMMER A COMPLEX PHENOMENON WITH A SIMPLE SOLUTION Waterhammer is an impact load that is ...
 - Android基础总结(九)
			
多媒体概念(了解) 文字.图片.音频.视频 计算机图片大小的计算(掌握) 图片大小 = 图片的总像素 * 每个像素占用的大小 单色图:每个像素占用1/8个字节 16色图:每个像素占用1/2个字节 25 ...