将interproscan的结果转化格式

很奇怪 tsv格式里没有go, kegg, inter-domain信息,但是xml文件里面却有,tsv文件比较好处理,所以先将xml文件转化为tsv。用软件自带的工具:

The convert mode is designed to work only for XML documents created with the same version. This makes sure we can introduce new schema updates in the future. However the XML schema is stable and will only change, if we need to add new features for instance.

You can use InterProScan 5's CONVERT mode to reformat your XML result file into any other possible output format (TSV, GFF3, SVG and HTML). For compatibility reasons you can also convert XML results into InterProScan 4.8 raw format. This will give our users enough time to migrate their pipeline to InterProScan 5.

Please note it is NOT possible to reformat any non-XML format. XML is the richest data type and is therefore the only format which allows us to produce any other format of interest.

To enable InterProScan 5 to run in CONVERT mode you need to set the mode option to 'CONVERT'.

Usage instructions

./interproscan.sh -mode convert

You will see the following usage instructions:

Welcome to InterProScan v5 CONVERT mode.usage: java -XX:+UseParallelGC -XX:+AggressiveOpts            -XX:+UseFastAccessorMethods -Xms512M -Xmx2048M -jar            interproscan-5.jar

Please give us your feedback by sending an email tointerhelp@ebi.ac.uk -b,--output-file-base <OUTPUT-FILE-BASE>   Optional, base output                                            filename.  Note that this                                            option and the --outfile (-o)                                            option are mutually exclusive.                                            The appropriate file extension                                            for the output format(s) will                                            be appended automatically. By                                            default the input file                                            path/name will be used.

 -d,--output-dir <OUTPUT-DIR>               Optional, output directory.                                            Note that this option and the                                            --outfile (-o) option or the                                            --output-file-base (-b) option                                            are mutually exclusive. The                                            appropriate file extension for                                            the output format(s) will be                                            appended automatically. By                                            default the input file                                            path/name will be used.

 -f,--formats <OUTPUT-FORMATS>              Optional, case-insensitive,                                            comma separated list of output                                            formats. Available formats are                                            TSV, GFF3 (default set) and                                            RAW (InterProScan 4 TSV),                                            HTML, SVG.

 -i,--xml <XML-FILE-PATH>                   Mandatory, path to the IMPACT                                            XML file that should be loaded                                            and converted.

 -o,--outfile <EXPLICIT_OUTPUT_FILENAME>    Optional explicit output file                                            name.  Note that this option                                            and the --output-file-base                                            (-b) option are mutually                                            exclusive. If this option is                                            given, you MUST specify a                                            single output format using the                                            -f option.  The output file                                            name will not be modified.                                            Note that specifying an output                                            file name using this option                                            OVERWRITES ANY EXISTING FILE.

 -T,--tempdir <TEMP-DIR>                    Optional, specify temporary                                            file directory. The default                                            location is /temp.

具体使用:

/share/bioinfo/miaochenyong/interproscan-software/tars/interproscan-5.7-48.0/interproscan.sh -mode convert -f tsv -i your_xml_file
如果输入文件为test.xml

默认输出文件为:test.xml.tsv

by freemao

FAFU

 

Interproscan, xml文件转化为tsv的更多相关文章

  1. C#中将xml文件反序列化为实例时采用基类还是派生类的问题

    基类: using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace ...

  2. Java中将xml文件转化为json的两种方式

    原文地址https://blog.csdn.net/a532672728/article/details/76312475 最近有个需求,要将xml转json之后存储在redis中,找来找去发现整体来 ...

  3. XML文件与实体类的互相转换

    XML文件与实体类的互相转换 一.将XML文件反序列化为实体类对象 1. 通常程序的配置信息都保存在程序或者网站的专门的配置文件中(App.config/web.config).但是现在为了演示XML ...

  4. R处理xml文件

    最近处理数据的时候需要处理一些xml文件,但是xml文件的格式之前并不是很熟悉.幸好R有一些函数可以帮助快速处理xml文件.其中的xmlToList函数尤其方便,可以使你从陌生的XML迅速回到熟悉的R ...

  5. Java 操纵XML之修改XML文件

    Java 操纵XML之修改XML文件 一.JAVA DOM PARSER DOM interfaces The DOM defines several Java interfaces. Here ar ...

  6. Java 操纵XML之读取XML文件

    Java 操纵XML之读取XML文件 一.JAVA DOM PARSER DOM interfaces The DOM defines several Java interfaces. Here ar ...

  7. Android中将xml布局文件转化为View树的过程分析(下)-- LayoutInflater源码分析

    在Android开发中为了inflate一个布局文件,大体有2种方式,如下所示: // 1. get a instance of LayoutInflater, then do whatever yo ...

  8. C++ 利用 libxl 将 Excel 文件转化为 Xml 文件

    在游戏开发工作中,策划和运营一般会用Excel来编写配置文件,但是程序读取配置,最方便的还是xml文件.所以最好约定一个格式,然后在二者之间做一个转化. 本文利用libxl来读取Excel文件,利用 ...

  9. Android中将xml布局文件转化为View树的过程分析(上)

    有好几周没写东西了,一方面是因为前几个周末都有些事情,另外也是因为没能找到好的写作方向,或者说有些话题 值得分享.写作,可是自己积累还不够,没办法只好闷头继续研究了.这段时间一边在写代码,一边也在想A ...

随机推荐

  1. Spring中处理Post方法中文乱码

    在Web.xml中配置: <!-- 注册Spring提供的处理Post请求的乱码问题 --> <filter> <filter-name>CharacterEnco ...

  2. 解决Jenkins console输出乱码

    背景 Jenkins console输出乱码,如 ������������� 1 解决办法 Jenkins Master 设置utf8 encoding Tomcat 启动脚本 export JAVA ...

  3. fiddler,https抓包设置

    1.fiddler 2 汉化版本不支持https证书下载,需要下载fiddler 4版本进行验证 若fiddler 2版本,可能存在无法访问Pc端fiddler返回页面,无法下载证书 2.打开Fidd ...

  4. Xcode7 创建HTTP请求报错

    最近在Xcode 7中向服务器发送请求访问JSON数据时, 控制台打印了以下错误信息: Application Transport Security has blocked a cleartext H ...

  5. Stack的pop和push操作

    #include <stack> #include <cstdio> using namespace std; int main(){ stack<int> s; ...

  6. Effective Java阅读笔记——引言

    “我很希望10年前就拥有这本书.可能有人认为我不需要任何Java方面的书籍,但是我需要这本书.” ——Java之父 James Gosling 在图书馆找到这本java著作时,首先看到了这句话.   ...

  7. [整]C#获取天气预报信息(baidu api)包括pm2.5

    /// <summary> /// 获取天气预报信息 /// </summary> /// <returns></returns> public Bai ...

  8. Nexus私服忘记用户名密码,Nexus私服如何找回用户名密码

    Maven搭建私服用Nexus很方便.但是如果忘记了管理员的密码,如何处理呢?Nexus私服如何找回用户名密码? 1. 找到nexus-XXXYYYY-bundle/sonatype-work/nex ...

  9. 安装Pod时提示ERROR: While executing gem ... (Errno::EPERM) Operation not permitted - /usr/bin/pod

    环境:OSX EI 10.11.1 昨天切换gem源后,招待pod安装没有任何问题,也可以正常用$ gem sources --add https://ruby.taobao.org/ --remov ...

  10. iOS开发UI篇—程序启动原理和UIApplication

    iOS开发UI篇—程序启动原理和UIApplication   一.UIApplication 1.简单介绍 (1)UIApplication对象是应用程序的象征,一个UIApplication对象就 ...