融合基因(Fusion gene)是指两个基因的全部或一部分的序列相互融合为一个新的基因的过程。其有可能是染色体易位、中间缺失或染色体倒置所致的结果。

异常的融合基因可以引起恶性血液疾病以及肿瘤。例如典型的EML4-ALK BCR-ABL融合基因可以导致白血病,此外还有在前列腺癌症里面经常被发现的TMPRSS2-ERG,在非小细胞肺癌里面经常发现的EML4-ALK,VTI1A-TCF7L2 (直肠癌)。

目前的融合基因分类有可分为一下5种:

目前已经很多在线工具,基于高通量测序数据来对检测融合基因。例如:soapfuse,FusionSeq , deFuse, TopHat-Fusion, Fusion- Hunter, SnowShoes-FTD, chimerascan ,FusionMap和STAMP。

这里我们以TopHat-Fusion为例:

1:首先运行tophat比对,并在参数设置种加入:--fusion-search 选项,实例如下:

tophat -p 10 -o ./tophat_sample_1 --fusion-search ./Bowtie2Index/genome PE_1.fastq PE_2.fastq

(注意:每个样本设立一个独立的输出文件夹,例如:./tophat_sample_1)

2:下载数据库(blastdb,ftp://ftp.ncbi.nlm.nih.gov/blast/db/)

其中要下载的数据包括:human_genomic.*;other_genomic*, and nt*。

以上数据库在服务器地址为:/home/fanyc/RNA-seq/tophat/blast

3:建立自己用户目录下建立.ncbirc文件,文件内容如下:

[BLAST]

BLASTDB=/home/fanyc/RNA-seq/tophat/blast

4:在运行完tophat比对后,在运行结果的当前目录建立blast文件夹,将你下载的数据存放在该文件下,或者软链接该文件夹下。此外在http://ccb.jhu.edu/software/tophat/fusion_tutorial.html网站下载你比对的对应物种的:ensGene.txt与refGene.txt。

5:另外在寻找融合基因的过程种,tophat 使用的是blastn程序,请从NCBI上下载blast,并建立blastn软链接到用户目录下。此外该程序会用到bowtie1.

6:在运行基因融合之前,请检查你当前目录下是否存在如下目录和文件:

◦ tophat_sample_1 - the output directory by tophat and you may want to run it on several samples.

◦ tophat_sample_2

◦ ...

◦ tophat_sample_n

◦ ensGene.txt

◦ refGene.txt

◦ blast - BLAST database

7:在确定完成以上操作后,可运行基因融合检测程序如下:

tophat-fusion-post -p 8 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 /path/to/bowtie_index

参考资料:

2009-Transcriptome Sequencing to Detect Gene Fusions in Cancer

2011-Identification of fusion genes in breast cancer by paired-end RNA-sequencing

2013-SOAPfuse: an algorithm for identifying fusion transcripts from paired-end RNA-Seq data

FusionCancer: a database of cancer fusion genes derived from RNA-seq data :http://donglab.ecnu.edu.cn/databases/FusionCancer/index.html

fusion--RNAseq的更多相关文章

  1. 史上最全 | 39个RNAseq分析工具与对比

    文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the ...

  2. RNA-seq差异表达基因分析之TopHat篇

    RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...

  3. A survey of best practices for RNA-seq data analysis RNA-seq数据分析指南

    A survey of best practices for RNA-seq data analysis RNA-seq数据分析指南 内容 前言 各位同学/老师,大家好,现在由我给大家讲讲我的文献阅读 ...

  4. 32、Differential Gene Expression using RNA-Seq (Workflow)

    转载: https://github.com/twbattaglia/RNAseq-workflow Introduction RNAseq is becoming the one of the mo ...

  5. Mac入门 (二) 使用VMware Fusion虚拟机

    有了Mac机,还是需在Mac上用Windows怎么办?, VMware Fusion 是运行在Mac机上的虚拟机软件, 类似于VMware workstation. 这样就可以在Mac上运行Windo ...

  6. Kinect for Windows SDK开发入门(十九):Kinect Fusion

        Kinect for Windows SDK1.7中引入了Kinect Fusion功能.在1.8的SDK中对该功能进行了改进和强化,Kinect Fusion能够使得我们使用Kinect f ...

  7. 【记录】vmware fusion 7 windows 10 unidentified network

    今天在 vmware fusion 7 中,使用 windows 10 时,突然报出一个错误(忘记截图了),当时就要求强制重启系统,也没怎么在意,但是重启之后,发现 windows 10 居然不能联网 ...

  8. 在macos上利用vmware fusion安装Ubuntu

    1. 安装vmware fusion http://www.vmware.com/products/fusion 下载以后,可以在网上找注册码,最好下载最新的,这里下载的是7的版本 2. 下载ubun ...

  9. VMware Fusion DHCP方式下如何指定虚拟机IP地址

    默认情况下,vmware fusion中的虚拟机,网卡设置成dhcp(动态分配 )时,会分配一个IP地址,但这个IP通常很难记,如果我们想为某台虚拟机挑一个好记的IP地址,可以按如下步骤操作: 命令行 ...

  10. VMware Fusion 中如何复制centos/linux虚拟机

    今天想在mac本上,弄几个centos的虚拟机,尝试搭建hadoop的全分布环境.一台台虚拟机安装过去太麻烦了,想直接将现有的centos虚拟机复制几份完事,但是复制出来的虚拟机无法上网,折腾了一翻, ...

随机推荐

  1. notefirst使用

    1:如果格式不正确,导入题录失败的话,可以手动添加.点击新建题录即可.输入文章的标题等信息. 2:导入word中的文献,可以使用word中notefirst的引文编辑功能,对文献进行删除,编辑等. 3 ...

  2. elasticsearch 6.0在Ubuntu下的安装

    1:直接下载 elasticsearch 6.0  zip文件  https://www.elastic.co/downloads/past-releases 2:解压:进入到解压后的bin目录,执行 ...

  3. PAT 1054 The Dominant Color[简单][运行超时的问题]

    1054 The Dominant Color (20)(20 分) Behind the scenes in the computer's memory, color is always talke ...

  4. 为什么要用Markov chain Monte Carlo (MCMC)

    马尔科夫链的蒙特卡洛采样的核心思想是构造一个Markov chain,使得从任意一个状态采样开始,按该Markov chain转移,经过一段时间的采样,逼近平稳分布stationary distrib ...

  5. javascript产生对象(不建议看)

    产生对象的方式:一.new+构造函数1.JavaScript的内置构造函数,如Date(),Function(),Array(),Object()2.自定义的构造函数二.对象字面量{}三.继承 用 v ...

  6. jxl(Java Excel API) 使用方法 【2】

    JAVA EXCEL API简介 Java Excel是一开放源码项目,通过它Java开发人员可以读取Excel文件的内容.创建新的Excel文件.更新已经存在的Excel文件.使用该 API非Win ...

  7. VMware Coding Challenge: Removing Duplicates Entries

    static LinkedListNode removeDuplicates(LinkedListNode list) { LinkedListNode cur = list; HashSet< ...

  8. Linux系统——LNMP分离式部署

    #### 安装nginx ```[root@localhost ~]# tar xf nginx-1.10.2.tar.gz -C /usr/src/[root@localhost ~]# cd /u ...

  9. Centos下添加PHP对MSSQL的支持

    Leave a reply 其实很少会有连接SQL Server的机会,不过我们公司刚好有个应用需要使用的SQL Server的数据库,所以也知道给LNMP安装MSSQL的扩展. 搜索网上的相关文章一 ...

  10. transition和animation区别

    Transform:对元素进行变形: Transition:对元素某个属性或多个属性的变化,进行控制(时间等),类似flash的补间动画.但只有两个关键贞.开始,结束. Animation:对元素某个 ...