interproscan 的使用和遇到的问题】的更多相关文章

将interproscan的结果转化格式 很奇怪 tsv格式里没有go, kegg, inter-domain信息,但是xml文件里面却有,tsv文件比较好处理,所以先将xml文件转化为tsv.用软件自带的工具: The convert mode is designed to work only for XML documents created with the same version. This makes sure we can introduce new schema updates…
InterProScan 5.18-57.0 安装和使用,目前最新版的interproscan 引用自 每日一生信--interproscan安装及使用(终结版)原文官网:http://code.google.com/p/interproscan/wiki/Introduction 配置要求:至少2 cores and 4 GB of RAM, 这样才能同时分析5 - 10 sequences . 软件要求: Linux, 32 bit or 64 bit (64 bit recommended…
错误一: 2014-10-08 13:09:32,238 [uk.ac.ebi.interpro.scan.jms.worker.LocalJobQueueListener:193] ERROR - Execution thrown when attempting to executeInTransaction the StepExecution.  All database activity rolled back. java.lang.IllegalStateException: IOExc…
InterProScan 5.25-64.0 安装和使用,目前最新版的interproscan 引用自 每日一生信--interproscan安装及使用(终结版)原文官网:http://code.google.com/p/interproscan/wiki/Introduction 配置要求:至少2 cores and 4 GB of RAM, 这样才能同时分析5 - 10 sequences . 软件要求: Linux, 32 bit or 64 bit (64 bit recommended…
interproscan 软件实际上将对输入的查询序列和interpro 数据库中的序列去比对,将比对上的序列对应的GO信息作为查询序列的GO注释 在interpro 数据库中,每条蛋白质序列有一个唯一的interpro 编号,类似 IPR034725 这种格式,而每条蛋白又有对应的GO注释信息: 可以通过下面的链接得到 IPR 编号和GO 注释信息之间的对应关系 ftp://ftp.ebi.ac.uk/pub/databases/interpro/interpro2go 这个链接中的内容如下:…
[protocol]GO enrichment analysis     背景: 什么是富集分析,自己可以百度.我到目前也没发现一个比较通俗易懂的介绍.直接理解为一种统计学方法就可以了. 用于查看显著性. 富集分析有很多种,最常见的是GO富集分析.也有pathway富集分析.[pathway的我目前不会啊 ::>_<:: ] 工具: 也有很多种,我这里主要是用Ontologizer (links:http://compbio.charite.de/contao/index.php/cmdlin…
#===============================      版本1  ===============================================InterProScan的三种使用方法Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能.是EBI开发的一个集成了蛋白质家族.结构域和功能位点的非冗余数据库.Interproscan整合了一些使用最普及的一些数据库,并应用于功能未知的蛋白进行Interpro注释和GO注释.以下介绍3中interp…
interpro 通过整合多个蛋白相关的数据库,提供了一个方便的对蛋白序列进行功能注释的平台,功能注释的内容包括蛋白质家族预测,domain 和 结合位点预测 interoro 在整合多个数据库的同时,去掉了冗余,提供了一个统一的接口,用来对序列进行功能注释:而且还提供了interproscan 这样的命令行工具,可以方便的对 大规模的蛋白序列进行注释,目前, UniprotKB 和 Gene Ontology 就是使用 interproscan 对蛋白序列进行注释的. interpro 数据库…
文章转载于 Original 2017-06-12 liuhui 生信百科 相似的基因在不同物种中,其功能往往保守的.显然,需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极大限制学术的交流.而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果. 所谓的 GO,是生物学功能注释的一个标准词汇表术语(GO term),将基因的功能分为三部分: 基因执行的分子功能(Mole…
Gene Ontology (GO) 注释  Posted on 2017-06-11 |  In 生信 相似的基因在不同物种中,其功能往往保守的.显然,需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极大限制学术的交流.而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果. 所谓的 GO,是生物学功能注释的一个标准词汇表术语(GO term),将基因的功能分为三部分:…
目录 一.来源 二.结果 测序组装 组装评价 编码基因预测 基因功能注释 非编码RNA注释 假基因预测 重复序列注释 进化分析和分歧时间估计 全基因组复制 LTR插入时间估计 正选择基因 一.来源 High-quality genome assembly, annotation and evolutionary analysis of the mungbean (Vigna radiata) genome. November 2020. DOI:10.22541/au.160587196.639…
前言 关于clusterProfiler这个R包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做GO和KEGG的功能富集及其可视化.简单总结下用法,以后用时可直接找来用. 首先考虑一个问题:clusterProfiler做GO和KEGG富集分析的注释信息来自哪里? GO的注释信息来自Bioconductor,提供了19个物种的org类型的GO注释信息,如下表所示.Bioconductor中更多的注释包可参考http://www.bioconductor.org/packages/rel…
导入数据 BGI开发的一款web工具,用于可视化GO注释结果.自己平时不用,但要介绍给别人,简单记录下要点,避免每次授课前自己忘了又要摸索. 地址:http://wego.genomics.org.cn/ 导入文件到灰色框中,可同时导入多个文件进行比较(点一次弹出一次).支持多种文件格式导入,如果是自己导入,可另存为txt导入,通常我们做GO注释后,会有这样一个基因和GO对应关系的文件: 如果是要做个样本比较的话,每个样本一个文件导入,这样才好比较. 也可用Launch WEGO Demo直接用…
目录 1. eggNOG简介 2. eggNOG-Mapper注释原理 3. eggNOG 5.0数据资源 4. eggNOG-Mapper使用 5. NOG.KOG.COG.KEGG.GO区别? 1. eggNOG简介 最近考虑到所用的一些数据库太旧了,需要更新.在整理的时候发现eggNOG数据库在去年的时候已经做了一次更新eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology reso…