背景:
          FrameBot 用于纠正DNA序列中的插入和缺失,然后正确的翻译成蛋白质序列,frameBot 工具集成在RDPTools 中
 
源代码:
 
 
安装:
          wget wget https://github.com/rdpstaff/RDPTools/archive/2.0.2.tar.gz     
         
 
测试:
    

    java -jar /home/panrf/Softwares/RDPTools/FrameBot.jar framebot
          -o ./test 
           -l 1 
           -i 0.8
          -N fungene_9.0_nifH_1989_unaligned_protein_seqs.4Analysis.fasta
          input.fasta
 
备注:  -o 指定输出结果的前缀,-l 指定氨基酸过滤的长度,i 指定比对的相似度,-N 指定功能基因对应的数据库, input.fasta 为输出的DNA序列
 
输出结果:
          输出5个文件:
          test_corr_nucl.fasta      :   翻译成功的DNA序列
          test_corr_prot.fasta     : 翻译成功的蛋白质序列
          BL18_failed_nucl.fasta : 翻译失败的DNA序列
          
 
          test_framebot.txt            : 翻译成功的DNA序列的比对情况 
          test_failed_framebot.txt  : 翻译失败的DNA序列的比对情况
          
 
test_framebot.txt : 内容如下:
>    Target    Query    NuclLen    AlignLen    %Identity    Score    Frameshifts    Reversed
STATS    38256851    7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;    318    106    99.057    530    0    false
Target   33 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    92
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Query     1 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    60
Frame       111111111111111111111111111111111111111111111111111111111111
            ACCACCGAGCGAACTCGGGGGTGGGCGAGGGAAAGTCGACTGGTGGCGCGGGTGGCGGAA
            CGTTTACACAACTTCTCCACGCTAATATAATTATGTGATGGTACGGCACGTGGCGGGTTC
            GGGCGCCGCGCCCGGGCCACCGGGCGGCGCCGGCCCCCCCCGGCTCGGGCGCCCCTCGCG
 
Target   93 SINFLEENGAYDGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   138
            ||||||||||| ||||||||||||||||||||||||||||||||||
Query    61 SINFLEENGAYEGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   106
Frame       1111111111111111111111111111111111111111111111
            TAATCGGAGGTGGGGTGTTGGCGGGGTGGTGACACGAAGCGATAGA
            CTATTAAAGCAAGTAATCAATTGATTGGGTCTCTGAAACAATATTT
            GCCCGAACCCTACGCCCCCCGGCCGGCCCTCGCCCGCGCGGCCCCG
 
表头注释:
Target :       数据库中的序列           38256851
Query :       查询序列                     7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;
NuclLen :    核酸序列长度              318
AlignLen  :   比对上的序列长度       106
%Identity :   比对的相似度             99.057
Score      :    比对的打分                530
Frameshifts : 移码                         0
Reversed :   是否相反                    false, 输入序列的氨基酸和数据库中的氨基酸序列是否反向互补
利用FrameBot 翻译氨基酸序列时, 首先将输入的核酸序列翻译成氨基酸,然后去和数据库中的氨基酸进行blast比对,如果该氨基酸长度大于预先设置的的长度阈值,而且比对的相似度大于预先设置的相似度的阈值,则输入序列成功翻译;
不同物种某个特定功能基因的氨基酸序列还是有很大差异的,如果一条核酸序列对应的氨基酸符合长度过滤的条件,但是由于和数据库中的氨基酸序列差异都较大,导致比对的相似度很低,也是翻译不成功;
从这个过程可以看到,数据库质量的好坏决定了输入序列能否翻译成功,对于功能基因而言,我们通常从FunGene 数据库下载对应的数据。
 
 
 
 
 

FrameBot 软件安装测试的更多相关文章

  1. motiMaker 软件安装测试

    背景: mitoMaker是一款线粒体/叶绿体组装的pipeline软件,可以从原始的下机数据开始,自动化的组装基因组,注释基因结构,最终生成genebank, fasta 等文件. 整个pipeli ...

  2. RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试

    RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试 特别说明: 电源接反,电机驱动板接反将有可能烧毁芯片和电路,请再三确认后再进行通电. 如何使用: 1.需要用到的模块或器件: Arduin ...

  3. 2019-9-16:渗透测试,基础学习,Linux下软件安装,环境搭建,笔记

    Centos linux下软件安装yum 通过分析rpm包头数据后,自动解决依赖关系,直接云端下载软件,根据不同版本系统获取不同软件信息,按顺序下载rpm包,安装软件yum search 软件名:搜索 ...

  4. 循序渐进Linux 3:Linux下软件安装与管理

    一.源码安装 ./configuremakemake install 二.RPM包 1. 安装软件包 rpm -i [辅助选项] file1.rpm file2.rpm主选项 -i: install, ...

  5. Ubuntu系统下面软件安装更新命令

    在ubuntu服务器下安装包的时候,经常会用到sudo apt-get install 包名 或 sudo pip install 包名,那么两者有什么区别呢? 1.区别 pip用来安装来自PyPI( ...

  6. openstack(liberty):部署实验平台(二,简单版本软件安装 part2)

    继续前面的part1,将后续的compute以及network部分的安装过程记录完毕! 首先说说compute部分nova的安装. n1.准备工作.创建数据库,配置权限!(密码依旧是openstack ...

  7. Linux下软件安装,卸载,管理

    一. 软件安装包的类型 通常Linux应用软件的安装有五种: 1) tar+ gz包,如software-1.2.3-1.tar.gz.     他是使用UNIX系统的打包工具tar打包的. 2) r ...

  8. Linux软件安装方法小结(附:rpm详解)(转载)

    在使用Linux系统的过程中,软件包的安装是避免不了的,在Linux下,软件安装程序的种类很多,安装方法也各式各样,(舒适性自然比不上windows :-))不过我们常见的软件包有两种: 1)含有软件 ...

  9. ubuntu下opencv2.4.9安装测试

    ubuntu下opencv2.4.9安装测试 whowhoha@outlook.com 一.依赖包安装 1.  build-essential 软件包 sudo apt-get install bui ...

随机推荐

  1. 部署openfire到linux环境下

    1.java环境部署:具体参考 http://blog.csdn.net/gufachongyang02/article/details/45337379 2.ant环境部署: 具体参考 http:/ ...

  2. 组策略分发Adobe Reader 11教程

    1, 实验环境 域控:Windows Server 2012 R2 客户端:Windows 7 Adobe Reader 版本:11.0.00 2, 获取分发 Adobe Reader 的许可协议 按 ...

  3. LeetCode: Maximum Subarray 解题报告

    Maximum Subarray Find the contiguous subarray within an array (containing at least one number) which ...

  4. python dataframe astype 字段类型转换

    使用dtype查看dataframe字段类型 print df.dtypes 使用astype实现dataframe字段类型转换 # -*- coding: UTF-8 -*- import pand ...

  5. uboot第一阶段关键位置分析

    /* * the actual reset code */ reset: /* * set the cpu to SVC32 mode */ mrs r0,cpsr bic r0,r0,#0x1f o ...

  6. delphi判断线程是否正在运行

    相关资料:http://www.delphitop.com/html/xiancheng/376.html unit Unit1; interface uses Winapi.Windows, Win ...

  7. APMServ升级php 与 Wamp升级PHP版本到5.3

    方法一:(我亲测试,没问题)首先下载:php-5.3.1-Win32-VC6-x86.ziphttp://windows.php.net/downloads/releases/archives/ 解压 ...

  8. 【Linux/CentOS】上手常见问题笔记

    场景:Web项目服务端想要运行在Linux系统上,还要编写一些自动化发布代码的Shell脚本,需要学习使用Linux系统. 环境:Windows系统下用虚拟机VMware Workstation Pr ...

  9. Java后端,应该日常翻看的中文技术网站<转>

    你还在学习吗? 1.内容生产者 InfoQ中文技术第一站,佩服霍老板,真金白银地为中国程序员们生产内容. ImportNew专门面向Java的内容生产者兼聚合者,偶然也有些面向入门的小白文. 并发编程 ...

  10. 负数在计算机中的表示 Byte-128

    本文转载: http://blog.csdn.net/njuitjf/article/details/4585247 原码:将一个整数,转换成二进制,就是其原码.如单字节的5的原码为:0000 010 ...