tophat-fusion 是一款利用RNA_seq 数据鉴定融合基因的工具,官网链接如下:

http://ccb.jhu.edu/software/tophat/fusion_index.shtml

安装:

tophat-fusion 是集成在tophat软件中的,具体的安装参考tophat的安装就好了

使用方法:

对于tophat-fusion 而言,要求固定的目录结构,比如我在result 文件夹下进行tophat-fusion的分析

那么我需要在该目录下准备几个文件:

1)物种对应的refGene.txt 和 ensGene.txt (这两个文件可以从UCSC下载得到)

2)  新建一个blast 文件夹,注意文件夹的名字必须为"blast", 在blast 文件夹下需要从NCBI下载 nt. human_genomic. other_genomic 开头的所有文件

下载的链接如下:

3)  tophat_fusion 的输出目录: 每个样本一个输出目录,输出目录的前缀为tophat_, 下划线之后加上样本名称,类似 tophat_MCF7;

当然你还需要物种对应的bowtie1 的索引文件,注意这里必须为bowtie1的索引,tophat 检测融合基因时推荐bowtie1的索引方式

上述文件都准备好之后,就可以开始分析了;

第一步:toohat 比对,和普通的比对类似,只不过为了融合基因的检测,需要添加几个额外的参数:

tophat2 -o tophat_MCF7 -p 20  --fusion-search --keep-fasta-order  --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --max-intron-length 100000 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM hg19_bowtie1/hg19  SRR064286_1.fastq SRR064286_2.fastq

第二步:tophat-fusion-post , 生成融合基因的结果

tophat-fusion-post -p 20 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 hg19_bowtie1/hg19

需要指出的是,tophat-fusion-post 根据固定的目录结构进行样本,如果有多个样本,每个样本单独进行tophat 比对,只要输出目录区分开即可,比如A,B,C 3个样本,就有3个输出文件夹

tophat_A, tophat_B, tophat_C

运行完成之后,会生成一个名为 tophatfusion_out 的文件夹,该文件夹下是所有样本的融合基因分析的结果:

1)result.hml : 所有样本的融合基因分析的结果,直接看这个html

如上所示。在result.html 中,首先给出预测得到的融合基因,以表格形式进行展示,每列的含义如下:

1. Sample name in which a fusion is identified
2. Gene on the "left" side of the fusion
3. Chromosome ID on the left
4. Coordinates on the left
5. Gene on the "right" side
6. Chromosome ID on the right
7. Coordinates on the right
8. Number of spanning reads - this is the number of reads that span a
fusion point all on their own. In other words, the read itself has a
fusion break point within it.
9. Number of spanning mate pairs - this is the number of pairs of reads
where one read maps entirely on the left and the other read maps
entirely on the right of the fusion break point. Neither read is split,
so these pairs are not counted at all in (8).
10. Number of spanning mate pairs where one end spans a fusion (reads spanning fusion with only a few bases are included).
If you follow the the 9th column, it shows coordinates "number1:number2"
where one end is located at a distance of "number1" bases from the left
genomic coordinate of a fusion and "number2" is similarly defined.

tophat-fusion 鉴定融合基因的更多相关文章

  1. RNA-seq差异表达基因分析之TopHat篇

    RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...

  2. Mol Cell Proteomics. | 用于鉴定新型融合转录本及其在癌细胞中的潜在翻译产物的多功能蛋白质组基因组学工具FusionPro

    期刊:Molecular & Cellular Proteomics 发表时间:June 17, 2019 DOI:10.1074/mcp.RA119.001456 分享人:任哲 内容与观点: ...

  3. 使用Tophat+cufflinks分析差异表达

    使用Tophat+cufflinks分析差异表达  2017-06-15 19:09:43     522     0     0 使用TopHat+Cufflinks的流程图 序列的比对是RNA分析 ...

  4. FusionCancer-人类癌症相关的融合基因的数据库

    RNA-seq 测序可以用于融合基因的发现,在过去的十几年里,RNA-seq 测序数据不断增加,发现的融合基因的数据也不断增加: FusionCancer 是一个人类癌症相关的融合基因的数据库,利用N ...

  5. FusionMap 检测融合基因

    定义:融合基因是指两个或者多个基因联合起来,一起转录形成一个转录本: 检测的意义:融合基因可以作为某些疾病的特异分子标记,比如 bcr/abl融合基因存在于95%以上的慢性粒细胞白血病患者中: AML ...

  6. BCR-ABL融合基因及检测

    费城染色体 费城染色体(Philadelphia chromosome, Ph (or Ph') chromosome),或称费城染色体易位(Philadelphia translocation),是 ...

  7. Mac入门 (二) 使用VMware Fusion虚拟机

    有了Mac机,还是需在Mac上用Windows怎么办?, VMware Fusion 是运行在Mac机上的虚拟机软件, 类似于VMware workstation. 这样就可以在Mac上运行Windo ...

  8. Kinect for Windows SDK开发入门(十九):Kinect Fusion

        Kinect for Windows SDK1.7中引入了Kinect Fusion功能.在1.8的SDK中对该功能进行了改进和强化,Kinect Fusion能够使得我们使用Kinect f ...

  9. 【记录】vmware fusion 7 windows 10 unidentified network

    今天在 vmware fusion 7 中,使用 windows 10 时,突然报出一个错误(忘记截图了),当时就要求强制重启系统,也没怎么在意,但是重启之后,发现 windows 10 居然不能联网 ...

随机推荐

  1. 【Socket】linux组播技术

    1.mystery引入      1)本学期学了计算机网络,对一些网络底层的东西还是不大了解    2)目前IP网络流行3种通信模式,分别是单播/广播与组播    3)根据Internet关于IP地址 ...

  2. 总结: Sort 排序算法

    排序总结 面试经验 硅谷某前沿小Startup面试时,问到的一个题目就是写一个快速排序算法.进而面试官问到了各种算法的算法复杂度,进而又问了Merge Sort 与 QuickSort 的优劣. 对排 ...

  3. C++中虚函数的作用是什么?它应该怎么用呢?

    虚函数联系到多态,多态联系到继承.所以本文中都是在继承层次上做文章.没了继承,什么都没得谈. 下面是对C++的虚函数这玩意儿的理解. 一, 什么是虚函数(如果不知道虚函数为何物,但有急切的想知道,那你 ...

  4. Python与操作系统有关的模块

    Os模块 Python的标准库中的os模块主要涉及普遍的操作系统功能.可以在Linux和Windows下运行,与平台无关.os.sep 可以取代操作系统特定的路径分割符.os.name字符串指示你正在 ...

  5. ThinkPHP使用Smarty

    ThinkPHP支持多种php模板引擎,可以根据个人需要加以配置. 第一步: 首先去Smarty官网上下载一个Smarty. 第二步: 解压压缩包,会有两个文件夹:demo和libs.打开libs文件 ...

  6. Android Toolbar的使用 顶部标题栏+后退键

    最近设计安卓里面有个标题栏,里面有个后退键,可以完成后退之类的功能. 好,刚好可以用Toolbar去实现 上代码:activity_main.xml <?xml version="1. ...

  7. 【转】 Java中的变量赋值和参数传递

    原文地址:http://blog.csdn.net/whmii/article/details/3363667 变量赋值和参数传递是java中两个容易让人迷惑的问题.对于原始类型(primitives ...

  8. MEMCACHE分布式算法(PHP)

    //测试分布式算法 $ports = array('端口1', '端口2', '端口3', '端口4', '端口5'); //Memcache端口 $users = array('1000', '10 ...

  9. win 安装pip和requests

    下载地址是:https://pypi.python.org/pypi/pip#downloads : 下载完成之后,解压到一个文件夹,用CMD控制台进入解压目录,输入: python setup.py ...

  10. 通过github搭建个人博客

    今天突发奇想,想用GitHub搭建一个个人博客,就大概学习了一下,特此记录. 其实非常简单,首先要知道,这里是通过GitHub Pages进行搭建的,什么?不知道什么是GitHub Pages?Git ...