StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件。

软件的下载

wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.6.Linux_x86_64.tar.gz
tar zxvf stringtie-1.3.6.Linux_x86_64.tar.gz

StringTie 使用说明:新版本更新之后去掉了一些参数

stringtie <input.bam ..> [-G <guide_gff>] [-l <label>] [-o <out_gtf>] [-p <cpus>]
[-v] [-a <min_anchor_len>] [-m <min_tlen>] [-j <min_anchor_cov>] [-f <min_iso>]
[-C <coverage_file_name>] [-c <min_bundle_cov>] [-g <bdist>] [-u]
[-e] [-x <seqid,..>] [-A <gene_abund.out>] [-h] {-B | -b <dir_path>}

选项:
--version : 输出软件的版本信息
-G 参考序列的基因注释文件 (GTF/GFF3)
-l 输出转录本的名称前缀 (default: STRG)
-f 最少转录本的比例 (default: 0.1)
-m 组装转录本的最小长度 (default: 200)
-o 组装转录本的GTF注释文件 (default: stdout)
-a 连接位点锚定序列的最小长度 (default: 10)
-j 连接位点的最小覆盖度 (default: 1)
-t 基于覆盖度对预测的转录本进行修正 (default: coverage trimming is enabled)
-c 组装转录本的reads最小覆盖度(default: 2.5)
-v 输出log 信息
-g 比对上的reads 间距大于阀值则新城一个新的转录束 (default: 50)
-C 输出参考转录本中被reads 覆盖到的转录本
-M 转录束允许多比对reads覆盖的最大占比 (default:0.95)
-p 线程(CPU)数 (default: 1)
-A 基因丰都输出文件
-B 在输出的GFT同目录下输出Ballgown table 文件
-b 在 <dir_path> 目录下输出Ballgown table 文件
-e 只对参考转录本进行丰都评估 (requires -G)
-x 不在参考序列区域组装任何的新转录本
-u 多比对校正 (default: correction enabled)
-h 输出软件的帮助信息

软件的使用
如果是只需要对已知的基因进行定量使用下面的命令

stringtie -p 18 -G Homo_sapiens.GRCh38.89.protein_coding.gtf -B -e -o Ctrl-1.gtf -A Ctrl-1_abundance.txt -l Ctrl-1 Ctrl-1.bam

使用的参数说明

-p 设置运行的线程数
-G 设置GTF基因组注释文件
-B 在GTF的输出目录下输出ballgown table文件,用于使用ballgown table进行差异表达分析
-e 只对参考转录本进行丰度的计算,需要提供GTF注释文件
-o 输出生成的GTF注释文件
-A 输出基因的丰度计算结果
-l 设置前缀名
最后接输入的bam文件,输入的bam文件是要排序之后的文件,一般是默认按照染色体顺序排序

如果是需要组装新的转录本使用下面的命令

stringtie CM11.bam -G CM.gtf -o CM11.gtf -f 0.3 -j 3 -c 5 -g 100 -s 10000 -p 24

使用的参数说明

-f 最少的转录本比例
-j 连接位点的最小长度
-c 组装的转录本的最小read覆盖度
-g 比对上的reads 间距大于阀值则新城一个新的转录束
-s 新版已经没有了这个参数,主要当作组装转录本的时候的一个阈值
-p 线程数
  • 比较新的版本才有merge功能,
    转录本合并模式使用说明:
  stringtie --merge [Options] { gtf_list | strg1.gtf ...}
选项
-G <guide_gff> 参考转录本的注释信息 (GTF/GFF3)
-o <out_gtf> 合并转录本的GTF输出文件 (default: stdout)
-m <min_len> 合并转录本的最小长度(default: 50)
-c <min_cov> 合并转录本的最低覆盖度(default: 0)
-F <min_fpkm> 合并转录本的最小FPKM值(default: 1.0)
-T <min_tpm> 合并转录本的最小TPM值(default: 1.0)
-f <min_iso> isoform 最小比例(default: 0.01)
-g <gap_len> 转录本见GAP长度小于阀值则合并两转录本 (default: 250)
-i 允许合并转录本中有内含子保留; by default
-l <label> 输出的转录本名称前缀 (default: MSTRG)

使用方法如下:
需要先将单个样品得到的gtf放到一个mergelist.txt文件里面,然后使用--merge参数即可,也可以设置-m,-c,-F,-T以及-f等参数对组装后的转录本在merge时进行过滤,同时也可以加入-G 参数输入参考的gtf注释文件

stringtie --merge -p 20 -o stringtie_merged.gtf mergelist.txt

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

 
 
 
 

转录组组装软件stringtie的更多相关文章

  1. 转录本组装软件StringTie的使用说明

    转录本组装软件StringTie的使用说明 StringTie 转录本组装软件StringTie的使用说明 转录组分析流程 HISTA + StringTie 组合.其Protocol 发表在Natu ...

  2. 转录组分析---Hisat2+StringTie+Ballgown使用

    转录组分析---Hisat2+StringTie+Ballgown使用 (2016-10-10 08:14:45) 转载▼ 标签: 生物信息学 转录组   1.Hisat2建立基因组索引: First ...

  3. SOAPdenovo组装软件使用记录

    背景: 1.为什么要从头测序组装基因组? 基因组是不同表型的遗传基础:获得参考基因组是深入研究一个生物体全基因组的第一步也是必须的一步:从头测序组装能够对新的测序物种构建参考基因组: 2.为什么要研究 ...

  4. 转录组的组装Stingtie和Cufflinks

    转录组的组装Stingtie和Cufflinks Posted: 十月 18, 2017  Under: Transcriptomics  By Kai  no Comments 首先这两款软件都是用 ...

  5. 基因组Denovo组装原理、软件、策略及实施

    目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...

  6. 安装三代组装canu、smartdenovo、wtdbg及矫正软件Racon、Nanopolish的安装

    1)三代组装软件 ------------------------------------------------------------------canu--------------------- ...

  7. NGS NGS ngs(hisat,stringtie,ballgown)

    NGS ngs(hisat,stringtie,ballgown) #HISAT (hierarchical indexing for spliced alignment of transcripts ...

  8. HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件

    HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件 2015年04月02日 11:35:47 夜丘 阅读数:8940 标签: 生物 更多 个人分类: 论文笔记   Bowt ...

  9. PBcR - 纠错及组装算法

    单分子测序reads(PB)的混合纠错和denovo组装 我们广泛使用的PBcR的原始文章就是这一篇 原文链接:Hybrid error correction and de novo assembly ...

随机推荐

  1. PHP查询oracle数据显示乱码问题

    1.Linux下 执行前脚本前先执行一下命令export NLS_LANG="SIMPLIFIED CHINESE_CHINA.AL32UTF8" 2.Windows下在代码里添加 ...

  2. Pytest权威教程10-捕获警告信息

    目录 捕获警告信息 @pytest.mark.filterwarnings 禁用警告摘要 完全禁用警告捕获 弃用警告和待命记录警告 确保代码触发弃用警告 用警告函数断言警告 录制警告 自定义失败消息 ...

  3. 「SCOI2011」棘手的操作

    传送门 Description 有\(N\)个节点,标号从\(1\)到\(N\),这\(N\)个节点一开始相互不连通.第$ i\(个节点的初始权值为\)a_i$ ,接下来有如下一些操作: U x y ...

  4. [luogu 5024] 保卫王国

    Problem Here Solution 这大概是一篇重复累赘的blog吧. 最小权覆盖集=全集-最大权独立集 强制取或不取,可以通过将权值修改成inf或者-inf 然后就用动态dp的套路就行了 动 ...

  5. SSH如何使用

    如何查看SSH服务是否已经安装? 在终端命令行执行 rpm -qa | grep "ssh" 执行结果请看下图,说明已经安装:其实在安装linux操作系统的时候默认就会安装上的. ...

  6. Nginx+Tomcat多实例及负载均衡配置

    Nginx+Tomcat多实例及负载均衡配置 采用nginx的反向代理负载均衡功能,配合后端的tomcat多实例来实现tomcat WEB服务的负载均衡 01 安装nginx服务 安装所需的pcre库 ...

  7. 设置虚拟机ip地址

    当我们在linux中输入命令ifconfig来查找ip地址的时候,可能会出现只有ipv6,而没有inet的情况,这时需要自己设定,有两种方式可供选择: 1,命令 ifconfig 设备名(如eth0) ...

  8. 熔断机制hystrix

    一.问题产生 雪崩效应:是一种因服务提供者的不可用导致服务调用者的不可用,并将不可用逐渐放大的过程 正常情况下的服务: 某一服务出现异常,拖垮整个服务链路,消耗整个线程队列,造成服务不可用,资源耗尽: ...

  9. web开发学习的网站

    网易云课堂>imooc>coursera   网易云课堂 imooc.com 关于web的视频会多一些 最近要学一个付费的课程   http://www.v2ex.com/t/154242 ...

  10. sysfs 控制gpio

    按照下面的命令点亮及熄灭LED pi@raspberrypi:/sys/class/gpio $echo 26 > exportpi@raspberrypi:/sys/class/gpio $ ...