1、数据库

orthodb数据:

odb10v0_levels.tab.gz:          NCBI taxonomy nodes where Ortho DB orthologous groups (OGs) are calculated
odb10v0_species.tab.gz: Ortho DB individual organism (aka species) ids based on NCBI taxonomy ids (mostly species level)
odb10v0_level2species.tab.gz: correspondence between level ids and species ids
odb10v0_genes.tab.gz: Ortho DB genes with some info
odb10v0_OGs.tab.gz: Ortho DB orthologous groups
odb10v0_OG2genes.tab.gz: OGs to genes correspondence
odb10v0_OG_xrefs.tab.gz: OG associations with GO, COG and InterPro ids
v9_v10_OGs_map.tab.gz mappings between the previous and current release orthologous group ids
odb10v0_fasta_<root>.tgz tar-ball with one fasta file per taxon id in the given root (bacteria,metazoa,fungi,plants)

2、odb10v0_levels.tab:

1. level NCBI taxonomy id

2. scientific name

3. total non-redundant count of genes in all underneath clustered species(在聚集的物种下面的所有的基因的总非重复计数)

4. total count of OGs built on it

5. total non-redundant count of species underneath

3、odb10v0_species.tab.gz

1. Ortho DB individual organism id, based on NCBI tax id

2. scientific name inherited from the most relevant NCBI tax id

3. genome asssembly id, when available

4. total count of clustered genes in this species

5. total count of the OGs it participates

6. mapping type, clustered(C) or mapped(M)

4、odb10v0_level2species.tab

1. top-most level NCBI tax id, one of [2,2157,2759,10239]

2. Ortho DB organism id

3. number of hops between the top-most level id and the NCBI tax id assiciated with the organism

4. ordered list of Ortho DB selected intermediate levels from the top-most level to the bottom one

5、odb10v0_genes.tab

1. Ortho DB unique gene id (not stable between releases)

2. organism tax id

3. protein original sequence id, as downloaded along with the sequence

4. Uniprot id, evaluated by mapping

5. ENSEMBL gene name, evaluated by mapping

6. NCBI gid, evaluated by mapping

7. description, evaluated by mapping

6、odb10v0_OG2genes.tab

1. OG unique id

2. Ortho DB gene id

7、odb10v0_OG_xrefs.tab

1. OG unique id

2. external DB or DB section

3. external identifier

4. number of genes in the OG associated with the identifier

参考

https://www.orthodb.org/?page=filelist

orthodb的更多相关文章

  1. 【基因组预测】braker2基因结构注释要点记录

    目录 流程使用 问题 记录下braker2的使用要点,以备忘记. 流程使用 braker2有很多流程,根据你的数据:组装的基因组.转录组.蛋白(同源,包括近缘或远缘)选择不同流程,官网有说明: htt ...

随机推荐

  1. WPF圆角按钮与触发颜色变化

    <Button x:Name="button1" Content="按钮1" Margin="10,10,0,0" Cursor=&q ...

  2. 关于text-align和text-align-last

    很多人都用过text-align,基本上也比较熟悉这个属性. text-align: left; // 左对齐 text-align: right; // 右对齐 text-align: center ...

  3. 《C++数据结构-快速拾遗》 树结构

    1.简单的二叉树结构 #include <iostream> using namespace std; typedef int DATA; //建立二叉树的简单结构 typedef str ...

  4. fabric-ca1.03安装

    前面的文档已经成功的安装了fabric1.0.1的e2e例子.之后代码换成1.0.3版本按步骤重新安装一下,就可以切换到1.0.3了.1.0.3的脚本和启动命令没有变化,还是用的1.0.1的. 1.准 ...

  5. spring boot js 文件引用 单引问题。

    首页 index.html 访问首页空白 . F12 控制台看页面元素布局.发现有两个body 标签 ,而且 </head> 标红. 各种检查....好像是没有问题. 但就是访问空白.去掉 ...

  6. ROS Industrial 简介

    ROS_I means ROS Industrial ROS_I 解决了哪些问题: 1. 让自动化可以互相协作,操纵器.末端执行器.感知系统/传感器,移动平台,周边设备,都可只用一种语言(ROS me ...

  7. uva-10026-贪心

    题意:有N项工作,每项工作完成需要n天,如果不开始做每天罚fee,开始做即不罚钱,求任务的执行顺序,使得罚钱最少.如果有多组答案,取下标排列最小的那组 解题思路: 考虑工作tn(dn,fn) , 假如 ...

  8. 关于php中的exec命令

    这个命令 一般是被禁用的  一些特殊需求的时刻 可以启用 比如 调用系统上的一些数据或者命令 $command ='/www/wwwroot/t.6328.net/Public/cfile/test' ...

  9. 18.Mysql搜索引擎及其区别

    这是面试中的问题:当时也是没有直接回答出来,还是因为基础知识不扎实. 一般Mysql常用的搜索引擎有:ISAM.MylSAM.HEAP.InnoDB.Berkley(BDB) ISAM:执行读取操作的 ...

  10. Linux将某目录授权给某组里的某用户

    chown -Rf 用户名:组名 目录