背景:
          FrameBot 用于纠正DNA序列中的插入和缺失,然后正确的翻译成蛋白质序列,frameBot 工具集成在RDPTools 中
 
源代码:
 
 
安装:
          wget wget https://github.com/rdpstaff/RDPTools/archive/2.0.2.tar.gz     
         
 
测试:
    

    java -jar /home/panrf/Softwares/RDPTools/FrameBot.jar framebot
          -o ./test 
           -l 1 
           -i 0.8
          -N fungene_9.0_nifH_1989_unaligned_protein_seqs.4Analysis.fasta
          input.fasta
 
备注:  -o 指定输出结果的前缀,-l 指定氨基酸过滤的长度,i 指定比对的相似度,-N 指定功能基因对应的数据库, input.fasta 为输出的DNA序列
 
输出结果:
          输出5个文件:
          test_corr_nucl.fasta      :   翻译成功的DNA序列
          test_corr_prot.fasta     : 翻译成功的蛋白质序列
          BL18_failed_nucl.fasta : 翻译失败的DNA序列
          
 
          test_framebot.txt            : 翻译成功的DNA序列的比对情况 
          test_failed_framebot.txt  : 翻译失败的DNA序列的比对情况
          
 
test_framebot.txt : 内容如下:
>    Target    Query    NuclLen    AlignLen    %Identity    Score    Frameshifts    Reversed
STATS    38256851    7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;    318    106    99.057    530    0    false
Target   33 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    92
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Query     1 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    60
Frame       111111111111111111111111111111111111111111111111111111111111
            ACCACCGAGCGAACTCGGGGGTGGGCGAGGGAAAGTCGACTGGTGGCGCGGGTGGCGGAA
            CGTTTACACAACTTCTCCACGCTAATATAATTATGTGATGGTACGGCACGTGGCGGGTTC
            GGGCGCCGCGCCCGGGCCACCGGGCGGCGCCGGCCCCCCCCGGCTCGGGCGCCCCTCGCG
 
Target   93 SINFLEENGAYDGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   138
            ||||||||||| ||||||||||||||||||||||||||||||||||
Query    61 SINFLEENGAYEGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   106
Frame       1111111111111111111111111111111111111111111111
            TAATCGGAGGTGGGGTGTTGGCGGGGTGGTGACACGAAGCGATAGA
            CTATTAAAGCAAGTAATCAATTGATTGGGTCTCTGAAACAATATTT
            GCCCGAACCCTACGCCCCCCGGCCGGCCCTCGCCCGCGCGGCCCCG
 
表头注释:
Target :       数据库中的序列           38256851
Query :       查询序列                     7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;
NuclLen :    核酸序列长度              318
AlignLen  :   比对上的序列长度       106
%Identity :   比对的相似度             99.057
Score      :    比对的打分                530
Frameshifts : 移码                         0
Reversed :   是否相反                    false, 输入序列的氨基酸和数据库中的氨基酸序列是否反向互补
利用FrameBot 翻译氨基酸序列时, 首先将输入的核酸序列翻译成氨基酸,然后去和数据库中的氨基酸进行blast比对,如果该氨基酸长度大于预先设置的的长度阈值,而且比对的相似度大于预先设置的相似度的阈值,则输入序列成功翻译;
不同物种某个特定功能基因的氨基酸序列还是有很大差异的,如果一条核酸序列对应的氨基酸符合长度过滤的条件,但是由于和数据库中的氨基酸序列差异都较大,导致比对的相似度很低,也是翻译不成功;
从这个过程可以看到,数据库质量的好坏决定了输入序列能否翻译成功,对于功能基因而言,我们通常从FunGene 数据库下载对应的数据。
 
 
 
 
 

FrameBot 软件安装测试的更多相关文章

  1. motiMaker 软件安装测试

    背景: mitoMaker是一款线粒体/叶绿体组装的pipeline软件,可以从原始的下机数据开始,自动化的组装基因组,注释基因结构,最终生成genebank, fasta 等文件. 整个pipeli ...

  2. RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试

    RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试 特别说明: 电源接反,电机驱动板接反将有可能烧毁芯片和电路,请再三确认后再进行通电. 如何使用: 1.需要用到的模块或器件: Arduin ...

  3. 2019-9-16:渗透测试,基础学习,Linux下软件安装,环境搭建,笔记

    Centos linux下软件安装yum 通过分析rpm包头数据后,自动解决依赖关系,直接云端下载软件,根据不同版本系统获取不同软件信息,按顺序下载rpm包,安装软件yum search 软件名:搜索 ...

  4. 循序渐进Linux 3:Linux下软件安装与管理

    一.源码安装 ./configuremakemake install 二.RPM包 1. 安装软件包 rpm -i [辅助选项] file1.rpm file2.rpm主选项 -i: install, ...

  5. Ubuntu系统下面软件安装更新命令

    在ubuntu服务器下安装包的时候,经常会用到sudo apt-get install 包名 或 sudo pip install 包名,那么两者有什么区别呢? 1.区别 pip用来安装来自PyPI( ...

  6. openstack(liberty):部署实验平台(二,简单版本软件安装 part2)

    继续前面的part1,将后续的compute以及network部分的安装过程记录完毕! 首先说说compute部分nova的安装. n1.准备工作.创建数据库,配置权限!(密码依旧是openstack ...

  7. Linux下软件安装,卸载,管理

    一. 软件安装包的类型 通常Linux应用软件的安装有五种: 1) tar+ gz包,如software-1.2.3-1.tar.gz.     他是使用UNIX系统的打包工具tar打包的. 2) r ...

  8. Linux软件安装方法小结(附:rpm详解)(转载)

    在使用Linux系统的过程中,软件包的安装是避免不了的,在Linux下,软件安装程序的种类很多,安装方法也各式各样,(舒适性自然比不上windows :-))不过我们常见的软件包有两种: 1)含有软件 ...

  9. ubuntu下opencv2.4.9安装测试

    ubuntu下opencv2.4.9安装测试 whowhoha@outlook.com 一.依赖包安装 1.  build-essential 软件包 sudo apt-get install bui ...

随机推荐

  1. 前端js上传文件插件

    1. plupload文件上传 2.ajaxfileupload文件上传

  2. js利用clipboardData在网页中实现截屏粘贴的功能

    目前仅有高版本的 Chrome 浏览器支持这样直接粘贴,其他浏览器目前为止还无法粘贴,不过火狐和ie11浏览器在可编辑的div中能够粘贴截图的图片也是base64位和Chrome利用clipboard ...

  3. win7 LR11.0 启动controller报:Failed to create Online:无效指针

    win7 LR11.0 启动controller报:Failed to create Online:无效指针 运行lr setup.exe 进行修复后问题解决 修复完成后,覆盖lr安装目录“bin”文 ...

  4. WCF终结点——终结点地址(EndpointAddress)

    终结点的地址的Uri属性作为终结点地址的唯一标示. 包括客户端终结点和服务端终结点. 一.服务端终结点: 服务端的终结点通过宿主的添加方法暴露出来,从而成为可以调用的资源. 下面是将服务绑定到宿主的代 ...

  5. 微服务之springCloud-docker-hystrix-dashboard-turbine(九)

    简介 Hystrix的主要优点之一是它收集关于每个HystrixCommand的一套指标.Hystrix仪表板以有效的方式显示每个断路器的运行状况,通过Hystrix Dashboard我们可以在直观 ...

  6. 【Visual Studio】项目的引用显示黄色叹号

    情况一:个别引用的DLL显示黄色叹号. 通常是因为该DLL需要的.Net Framework版本与当前项目使用的版本不兼容.如该DLL需要的版本高于当前项目使用的版本.考虑修改项目的.Net Fram ...

  7. Linux watchdog 关闭退出功能

    Linux 程序退出的时候,程序是会把 watchdog 调用 release 功能.

  8. android开发(30) 使用WebView,点击网页中的链接建立QQ 临时会话 WPA

    在PC端,我们可以通过一个URL链接,点击后启动QQ,这是很好的用户跳转体验.很方便. 使用的链接如下: <a target="_blank" href="http ...

  9. 用图片做div背景的列表布局 CSS代码

    思路: 1.因为是竖型列表,所以外层用 相对定位,这样 在不会重叠在一起 relative 2.里面用绝对位置 absolute,覆盖在图片上面 3.这里有个小技巧,我里面有个特效,文字竖立,并向右旋 ...

  10. Microsoft Azure

    Service Bus - Event Hub - Event Hubs Programming Guide - Service Bus Event Hubs Getting Started (Sam ...