RNA -seq

RNA-seq目的、用处::可以帮助我们了解,各种比较条件下,所有基因的表达情况的差异。

比如:正常组织和肿瘤组织的之间的差异;检测药物治疗前后,基因表达的差异;检测发育过程中,不同的发育阶段,不同的组织之间的基因表达差异 等

在所有检测的差异类型中,最常用的一种检测就是:检测所有mRNA的表达量的差异。

还可以检测 RNA 的结构上的差异。例如:mRNA的剪接方式的差异,即“可变剪接”;还可以检测“融合基因”,同时还可以检测基因单点突变导致的SNP

测序方法、步骤:人的细胞或组织,一般抽提到的总RNA当中,95%都是核糖体RNA。剩下的2%到3%是mRNA。还有2%到3%是Long non-coding RNA、或者tRNA、microRNA等

先把核糖体RNA先去掉。然后再进行建库测序。比如利用Poly(A)尾巴 抓出mRNA ,镁离子溶液打断,逆转录成cDNA ,再建库扩增,测序

表达量指标:目前最常用的是RPKM值,对基因表达量进行相对定量的一个指标。RPKM是 Reads Per Kilobase of exon model perMillion mapped reads。

除以这个外显子的长度,它的目的:是修正这个mRNA长度所引起的mRNA的Read数的偏差。

火山图:针对全转录组的分析,表达的是一次看到一个整体的样本(表达)差异的情况。

横轴表示某个基因的表达量是上升或下降。纵轴是表示这种差异的置信程度。这其中的每个点,就是两个样本当中同一个基因的mRNA表达量的变化。

聚类分析图:它是通过多个样本的全基因表达谱对比,来找到它们之间的相似性,和相近关系。

一张聚类分析的图,横轴是样本,纵轴是基因。

应用:我们可以分析疾病的亚型;还可以通过对多个基因在特定疾病当中的表达倾向性,来找出可能的、新的、诊断用的Biomark。

GO(gene ontology)分析

GO主要描述基因的三个属性:

第一,是这个基因,它参与的生物过程

第二,是这个基因产物的功能

第三、是这个基因产物在细胞器内的空间定位

差异基因GO富集柱状图:可以直观的反映出在生物过程、细胞组分、和分子功能富集的差异基因的个数分布情况。 柱子越高,则表示这个亚类当中突变越多。

有向无环图,是差异基因GO富集分析的图形化展示方式,从上到下,它所定义的功能范围越来越小、越来越精准。 它的分支,表示包含关系。而这个圈圈的颜色越深呐,表示这个富集关系程度越高。

通路(Pathway)分析:在系统水平上完成生物的某一功能的基本单元、或者局部子网络。

散点图是KEGG富集分析结果的图形化展示方式。

在图中,KEGG富集程度通 Rich factor、Qvalue 和 富集到此通路上的基因个数 来衡量。

富集因子越大,则表示富集的程度越大。 qValue是校正之后的pValue,它越接近于0表示富集程度越显著。点面积越大呐,则富集的基因数越多。

RNA-seq中,可以测到mRNA上的各种结构上的变异,即RNA序列的变异。要求测序深度要更深。因为这样才能得到较完整的覆盖,更有把握判断 新的剪接点、一个断点、哪儿碱基发生了突变等。

结构变异分析

可变剪接:一般一个人的组织样本当中,可以通过高通量测序,发现有5000个到20000个左右的可变剪接。

基因融合:融合基因的示意图,圆形 圆内弧线连接图

点突变(SNP):泡泡图,泡泡越大 突变频率越高,由大到小逆时针排列

RNA -seq的更多相关文章

  1. RNA seq 两种计算基因表达量方法

    两种RNA seq的基因表达量计算方法: 1. RPKM:http://www.plob.org/2011/10/24/294.html 2. RSEM:这个是TCGAdata中使用的.RSEM据说比 ...

  2. RNA测序相对基因表达芯片有什么优势?

    RNA测序相对基因表达芯片有什么优势? RNA-Seq和基因表达芯片相比,哪种方法更有优势?关键看适用不适用.那么RNA-Seq适用哪些研究方向?是否您的研究?来跟随本文了解一下RNA测序相对基因表达 ...

  3. featureCounts 软件说明

    featuresCounts 软件用于定量,不仅可以支持gene的定量,也支持exon, gene bodies, genomic bins, chromsomal locations的定量: 官网 ...

  4. Advances in Single Cell Genomics to Study Brain Cell Types | 会议概览

    单细胞在脑科学方面的应用 Session 1: Deciphering the Cellular Landscape of the Brain Using Single Cell Transcript ...

  5. xgene:WGS,突变与癌,RNA-seq,WES

     人类全基因组测序06 SNP(single nucleotide polymorphism):有了10倍以上的覆盖深度以后,来确认SNP信息,就相当可靠了. 一个普通黄种人的基因组,与hg19这个参 ...

  6. 链终止法|边合成边测序|Bowtie|TopHat|Cufflinks|RPKM|FASTX-Toolkit|fastaQC|基因芯片|桥式扩增|

    生物信息学 Sanger采用链终止法进行测序 带有荧光基团的ddXTP+其他四种普通的脱氧核苷酸放入同一个培养皿中,例如带有荧光基团的ddATP+普通的脱氧核苷酸A.T.C.G放入同一个培养皿,以此类 ...

  7. 08 Translating RNA into Protein

    Problem The 20 commonly occurring amino acids are abbreviated by using 20 letters from the English a ...

  8. xgene:之ROC曲线、ctDNA、small-RNA seq、甲基化seq、单细胞DNA, mRNA

    灵敏度高 == 假阴性率低,即漏检率低,即有病人却没有发现出来的概率低. 用于判断:有一部分人患有一种疾病,某种检验方法可以在人群中检出多少个病人来. 特异性高 == 假阳性率低,即错把健康判定为病人 ...

  9. BZOJ1798: [Ahoi2009]Seq 维护序列seq[线段树]

    1798: [Ahoi2009]Seq 维护序列seq Time Limit: 30 Sec  Memory Limit: 64 MBSubmit: 5504  Solved: 1937[Submit ...

随机推荐

  1. lerna基本试用

    安装 yarn global add lerna or npm install -g lerna 基本项目 初始化 git init platform cd platform lerna init 效 ...

  2. p/Invoke工具

    开源的工具 下面这个链接来下载这个工具: http://download.microsoft.com/download/f/2/7/f279e71e-efb0-4155-873d-5554a06085 ...

  3. bitmapdata的知识点

    flashplayer的cpu渲染 bitmapData占用的内存分两块,一块是原始数据区,另一块是解压后的内存区10秒内如果没有使用这个bitmapdata,解压后的内存区会被释放,当10秒后重新使 ...

  4. Keil for ARM与C++

    1. 如果你的程序中使用了C++全局变量,那么*不要*使用MicroLIB,否则Keil会说某某Symbol找不到 2. 不使用MicroLIB带来的一个问题是KEIL会使用semihosting S ...

  5. 面试总结之MISC(操作系统,网络,数学,软件开发,测试,工具,系统设计,算法)

    操作系统 解释堆和栈的区别. 分配在堆的内存与分配在堆栈的内存有什么不同 分配在堆的内存要手动去释放 线程与进程的区别 多线程中栈与堆是公有的还是私有的 在多线程环境下,每个线程拥有一个栈和一个程序计 ...

  6. POJ 2777-题解

    一.题意 给你一排N个格子,M种颜色,P个操作.有两种操作:(1)C A B D:把[A, B]区间内的所有格子涂成颜色D.(2)P A B:输出[A, B]区间内的颜色的种类数.注意,初始颜色为1. ...

  7. varnish/squid/nginx cache 有什么不同?

    SQUID 是功能最全面的,但是架构太老,性能不咋的Varnish 是内存缓存,速度一流,但是内存缓存也限制了其容量,缓存页面和图片一般是挺好的Nginx 本来是反向代理/web服务器,用了插件可以做 ...

  8. django内置html模板的extends和include,模板标签{{ ex }}

    base.html内容 <!DOCTYPE html> <html lang="en"> <head> <meta charset=&qu ...

  9. tcpdf中文解决方案

    步骤如下:1.确保你测试tcpdf能正常输出英文内容的pdf2.测试输入中文内容后显示是?的乱码或者空白分析原因,是因为我们输入的中文,tcpdf字体库并不支持,因此乱码或者空白显示 添加一个合适的字 ...

  10. 使用phpexcel导出到xls文件的时候出现乱码解决

    <?php include 'global.php'; $ids = $_GET['ids']; $sql = "select * from crm_cost_end where id ...