融合基因(Fusion gene)是指两个基因的全部或一部分的序列相互融合为一个新的基因的过程。其有可能是染色体易位、中间缺失或染色体倒置所致的结果。

异常的融合基因可以引起恶性血液疾病以及肿瘤。例如典型的EML4-ALK BCR-ABL融合基因可以导致白血病,此外还有在前列腺癌症里面经常被发现的TMPRSS2-ERG,在非小细胞肺癌里面经常发现的EML4-ALK,VTI1A-TCF7L2 (直肠癌)。

目前的融合基因分类有可分为一下5种:

目前已经很多在线工具,基于高通量测序数据来对检测融合基因。例如:soapfuse,FusionSeq , deFuse, TopHat-Fusion, Fusion- Hunter, SnowShoes-FTD, chimerascan ,FusionMap和STAMP。

这里我们以TopHat-Fusion为例:

1:首先运行tophat比对,并在参数设置种加入:--fusion-search 选项,实例如下:

tophat -p 10 -o ./tophat_sample_1 --fusion-search ./Bowtie2Index/genome PE_1.fastq PE_2.fastq

(注意:每个样本设立一个独立的输出文件夹,例如:./tophat_sample_1)

2:下载数据库(blastdb,ftp://ftp.ncbi.nlm.nih.gov/blast/db/)

其中要下载的数据包括:human_genomic.*;other_genomic*, and nt*。

以上数据库在服务器地址为:/home/fanyc/RNA-seq/tophat/blast

3:建立自己用户目录下建立.ncbirc文件,文件内容如下:

[BLAST]

BLASTDB=/home/fanyc/RNA-seq/tophat/blast

4:在运行完tophat比对后,在运行结果的当前目录建立blast文件夹,将你下载的数据存放在该文件下,或者软链接该文件夹下。此外在http://ccb.jhu.edu/software/tophat/fusion_tutorial.html网站下载你比对的对应物种的:ensGene.txt与refGene.txt。

5:另外在寻找融合基因的过程种,tophat 使用的是blastn程序,请从NCBI上下载blast,并建立blastn软链接到用户目录下。此外该程序会用到bowtie1.

6:在运行基因融合之前,请检查你当前目录下是否存在如下目录和文件:

◦ tophat_sample_1 - the output directory by tophat and you may want to run it on several samples.

◦ tophat_sample_2

◦ ...

◦ tophat_sample_n

◦ ensGene.txt

◦ refGene.txt

◦ blast - BLAST database

7:在确定完成以上操作后,可运行基因融合检测程序如下:

tophat-fusion-post -p 8 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 /path/to/bowtie_index

参考资料:

2009-Transcriptome Sequencing to Detect Gene Fusions in Cancer

2011-Identification of fusion genes in breast cancer by paired-end RNA-sequencing

2013-SOAPfuse: an algorithm for identifying fusion transcripts from paired-end RNA-Seq data

FusionCancer: a database of cancer fusion genes derived from RNA-seq data :http://donglab.ecnu.edu.cn/databases/FusionCancer/index.html

fusion--RNAseq的更多相关文章

  1. 史上最全 | 39个RNAseq分析工具与对比

    文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the ...

  2. RNA-seq差异表达基因分析之TopHat篇

    RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...

  3. A survey of best practices for RNA-seq data analysis RNA-seq数据分析指南

    A survey of best practices for RNA-seq data analysis RNA-seq数据分析指南 内容 前言 各位同学/老师,大家好,现在由我给大家讲讲我的文献阅读 ...

  4. 32、Differential Gene Expression using RNA-Seq (Workflow)

    转载: https://github.com/twbattaglia/RNAseq-workflow Introduction RNAseq is becoming the one of the mo ...

  5. Mac入门 (二) 使用VMware Fusion虚拟机

    有了Mac机,还是需在Mac上用Windows怎么办?, VMware Fusion 是运行在Mac机上的虚拟机软件, 类似于VMware workstation. 这样就可以在Mac上运行Windo ...

  6. Kinect for Windows SDK开发入门(十九):Kinect Fusion

        Kinect for Windows SDK1.7中引入了Kinect Fusion功能.在1.8的SDK中对该功能进行了改进和强化,Kinect Fusion能够使得我们使用Kinect f ...

  7. 【记录】vmware fusion 7 windows 10 unidentified network

    今天在 vmware fusion 7 中,使用 windows 10 时,突然报出一个错误(忘记截图了),当时就要求强制重启系统,也没怎么在意,但是重启之后,发现 windows 10 居然不能联网 ...

  8. 在macos上利用vmware fusion安装Ubuntu

    1. 安装vmware fusion http://www.vmware.com/products/fusion 下载以后,可以在网上找注册码,最好下载最新的,这里下载的是7的版本 2. 下载ubun ...

  9. VMware Fusion DHCP方式下如何指定虚拟机IP地址

    默认情况下,vmware fusion中的虚拟机,网卡设置成dhcp(动态分配 )时,会分配一个IP地址,但这个IP通常很难记,如果我们想为某台虚拟机挑一个好记的IP地址,可以按如下步骤操作: 命令行 ...

  10. VMware Fusion 中如何复制centos/linux虚拟机

    今天想在mac本上,弄几个centos的虚拟机,尝试搭建hadoop的全分布环境.一台台虚拟机安装过去太麻烦了,想直接将现有的centos虚拟机复制几份完事,但是复制出来的虚拟机无法上网,折腾了一翻, ...

随机推荐

  1. iphone传照片还是用QQ比较好

    之前设置相机格式为高效,通过用91助手的苹果助手导出来文件格式为HEIC,window下没法打开.网上介绍用微信传,发现传的是缩略图,不清楚.最后选择通过qq传比较高清.注意,如果从相册中进行选择的话 ...

  2. iOS 新浪微博-1.0框架搭建

    项目搭建 1.新建一个微博的项目,去掉屏幕旋转 2.设置屏幕方向-->只有竖向 3.使用代码构建UI,不使用storyboard 4.配置图标AppIcon和LaunchImage 将微博资料的 ...

  3. servlet07

    1.session验证 可以防止非登录的用户,通过在地址栏中输入地址,访问受保护的页面 step1.在用户登录成功之后,将用户的信息保存到session中 step2.在访问受保护的页面时,校验ses ...

  4. 有意思的JSON.parse()、JSON.stringify()

    前言 现在JSON格式在web开发中非常重要,特别是在使用ajax开发项目的过程中,经常需要将后端响应的JSON格式的字符串返回到前端,前端解析成JS对象值(JSON 对象),再对页面进行渲染. 在数 ...

  5. mysql表空间文件

    1.共享表空间文件.默认表空间文件是ibdata1,大小为10M,且可拓展.共享表空间可以由多个文件组成,一个表可以跨多个文件而存在,共享表空间的最大值限制是64T. 2.独立表空间文件.独立表空间只 ...

  6. MFC六大核心机制之三:动态创建

    MFC中很多地方都使用了动态创建技术.动态创建就是在程序运行时创建指定类的对象.例如MFC的单文档程序中,文档模板类的对象就动态创建了框架窗口对象.文档对象和视图对象.动态创建技术对于希望了解MFC底 ...

  7. yii的url写法

    Yii 各种url地址写法 echo Url::home(); 生成入口地址/yii2test/frontend/web/index.php: echo  Url::base();生成入口文件夹地址: ...

  8. python-自定义异常,with用法

    抛出异常 #coding=utf-8 def  exceptionTest(num): if num<0: print "if num<0" raise Excepti ...

  9. linux基础命令---umask

    umask 指定创建文件时所需要的权限掩码,掩码的执行权限对于文件没有效果.如果模式以数字开头,则解释为八进制数字:否则解释为符号模式掩码,类似于chmod(1)所接受的模式掩码.如果省略模式,则打印 ...

  10. java commons.lang3 ArrayUtils使用

    java commons.lang3 ArrayUtils使用import org.apache.commons.lang3.ArrayUtils; /** *数组追加数组,不重复 */ public ...