转录本组装软件StringTie的使用说明

转录本组装软件StringTie的使用说明

转录组分析流程 HISTA + StringTie 组合。其Protocol 发表在Nature Protocol 上“Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown

其中StringTie 在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升。

StringTie 使用说明:

stringtie <input.bam ..> [-G <guide_gff>] [-l <label>] [-o <out_gtf>] [-p <cpus>]

[-v] [-a <min_anchor_len>] [-m <min_tlen>] [-j <min_anchor_cov>] [-f <min_iso>]

[-C <coverage_file_name>] [-c <min_bundle_cov>] [-g <bdist>] [-u]

[-e] [-x <seqid,..>] [-A <gene_abund.out>] [-h] {-B | -b <dir_path>}

选项:

--version : 输出软件的版本信息

-G 参考序列的基因注释文件 (GTF/GFF3)

-l 输出转录本的名称前缀 (default: STRG)

-f 最少转录本的比例 (default: 0.1)

-m 组装转录本的最小长度 (default: 200)

-o 组装转录本的GTF注释文件 (default: stdout)

-a 连接位点锚定序列的最小长度 (default: 10)

-j 连接位点的最小覆盖度 (default: 1)

-t 基于覆盖度对预测的转录本进行修正 (default: coverage trimming is enabled)

-c 组装转录本的reads最小覆盖度(default: 2.5)

-v 输出log 信息

-g 比对上的reads 间距大于阀值则新城一个新的转录束 (default: 50)

-C 输出参考转录本中被reads 覆盖到的转录本

-M 转录束允许多比对reads覆盖的最大占比 (default:0.95)

-p 线程(CPU)数 (default: 1)

-A 基因丰都输出文件

-B 在输出的GFT同目录下输出Ballgown table 文件

-b 在 <dir_path> 目录下输出Ballgown table 文件

-e 只对参考转录本进行丰都评估 (requires -G)

-x 不在参考序列区域组装任何的新转录本

-u 多比对校正 (default: correction enabled)

-h 输出软件的帮助信息

转录本合并模式使用说明:

stringtie --merge [Options] { gtf_list | strg1.gtf ...}

选项

-G <guide_gff>   参考转录本的注释信息 (GTF/GFF3)

-o <out_gtf>     合并转录本的GTF输出文件 (default: stdout)

-m <min_len>     合并转录本的最小长度(default: 50)

-c <min_cov>     合并转录本的最低覆盖度(default: 0)

-F <min_fpkm>    合并转录本的最小FPKM值(default: 1.0)

-T <min_tpm>     合并转录本的最小TPM值(default: 1.0)

-f <min_iso>     isoform 最小比例(default: 0.01)

-g <gap_len>     转录本见GAP长度小于阀值则合并两转录本 (default: 250)

-i               允许合并转录本中有内含子保留; by default

-l <label>       输出的转录本名称前缀 (default: MSTRG)

 
如果您对转录组数据分析感兴趣的话,可以学习我的课程:
有参转录组数据分析

转录本组装软件StringTie的使用说明的更多相关文章

  1. 转录组组装软件stringtie

    StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件. ...

  2. SOAPdenovo组装软件使用记录

    背景: 1.为什么要从头测序组装基因组? 基因组是不同表型的遗传基础:获得参考基因组是深入研究一个生物体全基因组的第一步也是必须的一步:从头测序组装能够对新的测序物种构建参考基因组: 2.为什么要研究 ...

  3. Git&sourceTree软件安装、使用说明及遇到问题解决

    一.软件版本 1.Git版本为1.9.5 2.Source版本为1.5.2 二.软件安装步骤 1.Git安装步骤 1)双击Git安装文件进入下图界面,单击Next 2)继续Next 3)进入Selec ...

  4. 安装三代组装canu、smartdenovo、wtdbg及矫正软件Racon、Nanopolish的安装

    1)三代组装软件 ------------------------------------------------------------------canu--------------------- ...

  5. 基因组Denovo组装原理、软件、策略及实施

    目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...

  6. StringTie用法详解

    StringTie 参考链接: https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual#input https://www.cnblog ...

  7. HISAT2,StringTie,Ballgown处理转录组数据

    HISAT2,StringTie,Ballgown处理转录组数据 本文总阅读量次2017-05-26 HISAT2,StringTie,Ballgown处理转录组数据思路如下: 数据质控 将RNA-s ...

  8. HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件

    HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件 2015年04月02日 11:35:47 夜丘 阅读数:8940 标签: 生物 更多 个人分类: 论文笔记   Bowt ...

  9. PBcR - 纠错及组装算法

    单分子测序reads(PB)的混合纠错和denovo组装 我们广泛使用的PBcR的原始文章就是这一篇 原文链接:Hybrid error correction and de novo assembly ...

随机推荐

  1. ubuntu14安装TensorFlow

    1.安装ubuntu 网址:https://www.cnblogs.com/blog4matto/p/5581914.html 选择ubuntu14的原因:最初是想安装16的,后来发现总出问题,网上查 ...

  2. http协议解析过程

    HTTP是一个属于应用层的面向对象的协议,由于其简捷.快速的方式,适用于分布式超媒体信息系统. 基于HTTP协议的客户端/服务器请求响应机制的信息交换过程包含下面几个步骤: 1)     建立连接:客 ...

  3. python爬取股票信息

    import requests from bs4 import BeautifulSoup import traceback import re def getHTMLText(url): try: ...

  4. python return 及lambda函数

    return有两个作用: 1.用来返回函数的运行结果,或者调用另外一个函数.比如max()函数 >>> def fun(a,b): #返回函数结果. return max(a,b) ...

  5. angularjs directive scope 与父scope双向绑定

    参考 http://www.jb51.net/article/83051.htm angluar.module("aaa").directive("testDirecti ...

  6. cf-Global Round2-E. Pavel and Triangles

    题目链接:http://codeforces.com/contest/1119/problem/E 题意:给定n个数a[i],分别表示长度为2i-1的木条的数量,问使用这些木条最多能构成多少三角形. ...

  7. Perl 随机数据生成

    问题:在IC设计及验证过程中,经常会遇到mem初始化的问题,这时候需要产生hex 的文件,本程序实现这种需求,只需要输入行数,及hex文件的宽度即可. print"Hello World!\ ...

  8. Balanced Numbers (数位DP)

    Balanced Numbers https://vjudge.net/contest/287810#problem/K Balanced numbers have been used by math ...

  9. Codeforces Beta Round #59 (Div. 2)

    Codeforces Beta Round #59 (Div. 2) http://codeforces.com/contest/63 A #include<bits/stdc++.h> ...

  10. 【Linux 进程】exec族函数详解

    exec族的组成: 在Linux中,并不存在一个exec()的函数形式,exec指的是一组函数,一共有6个,分别是: #include <unistd.h> extern char **e ...