RNA-seq数据综合分析教程 AKAP95
https://blog.csdn.net/l_yivs?t=1
RNA-seq数据综合分析教程
- 2
- 4,055
- A+
mRNA-seq是目前最常用的高通量测序技术,一般的用法就是看看基因表达谱,寻找差异表达的基因。我和高通量测序数据分析结缘,也是因为RNA-seq。
一开始我对mRNA-seq数据分析一无所知,跑了"tophat+cufflinks"的流程也不知道每一步的原因,把“RNA-seq data analysis:A pratice approach” 看了好几遍,也是云里雾里,当然这些时间并没有白白浪费,终于有一天我恍然大悟,感觉自己终于懂了mRNA-seq数据分析,于是在暑假通过一次实战对自己的所学做了一个总结。
- 转录组入门(1):软件准备
- 转录组入门(2):读文章拿到测序数据
- 转录组入门(3):质量控制
- 转录组入门(4):了解参考基因组及基因注释
- 转录组入门(5): 序列比对
- 转录组入门(6): reads计数
- 转录组入门(7):差异表达分析
- 转录组入门(8): 富集分析
但是到目前为止,我实际遇到mRNA-seq数据分析分析项目就一个,不过问我问题的人还是有的,于是打算一边整理实验的流程,再稍微整理下自己的对这方面的理解。
先来看一道RNA-seq数据分析的题目吧,能解决这道题目意味着你真的理解了RNA-seq数据分析。这道问题很简单,不需要强大的计算能力,只需要一张纸和一支笔而已。
这道题目出自 The biostar handbook
假设有一个物种非常的小,仅仅只有三个基因: A, B, C,并且这三个基因都转录本长度分别为10bp, 100bp, 1000bp. 你想通过两个不同的条件下研究该物种,分别是野生型(WT)和热激后(HWEAT)。
由于神秘力量,你知道在WT条件下,基因A的表达量是基因B的表达量的两倍,你还知道在WT和HEAT两个条件中只有一个基因发生了变化(其他基因不变),并且该变化能用目前研究手段中检测到。
你为了找那个在WT和HEAT里不同的基因,非常激动的去做了一次没有重复的RNA-seq实验。由于你很激动,所以不小心把样本混在了一起,而且混了比HEAT处理多一倍WT的DNA量。不过好消息是样本还是能够分开的,毕竟加了barcode。最终结果就是你测了2倍的WT DNA和一倍的HEAT。
问题:你需要准确的用read覆盖情况来表征根据上述给的条件。数字不重要,你可以随便写,重点是这些数字能够表征基因的表达情况。请用实际的数字来替代下面的问号部分
| ID | WT | HEAT |
|---|---|---|
| A | ? | ? |
| B | ? | ? |
| C | ? | ? |
思考题:当你觉得你选择的数字能够回答上面的问题,那么再来想想下面的题目,如果你能回答所有问题,那么那就理解RNA-seq是如何工作的啦。
- 由于你在仪器里放了两倍WT材料,你是如何区分出你的样本?
- 每个条件下,每个基因的CPM是多少?
- 每个条件下,每个基因的RPKM是多少?
- 每个条件下,每个基因的TPM是多少?
- 你怎么知道基因在WT样本中,基因A的表达量真的是基因B表达量的两倍?
- 你能知道WT和HEAT处理中表达量发生变化的基因嘛?
- 当前面的3X2的位置的“?”都有了正确的值,这个问题也是可解决的嘛?
然后,你可以再想想:
- 你需要测多少的read,才能让CPM有一个不错的数值?
- 你需要测多少的read,才能让RPKM有一个不错的数值?
- 你需要测多少的read,才能让TPM有一个不错的数值?
- 你觉得引入上述这些具有任意比例因子的措施是否有意义,还是只为了让数字看起来“很好”?
RNA-seq数据综合分析教程 AKAP95的更多相关文章
- RNA seq 两种计算基因表达量方法
两种RNA seq的基因表达量计算方法: 1. RPKM:http://www.plob.org/2011/10/24/294.html 2. RSEM:这个是TCGAdata中使用的.RSEM据说比 ...
- 最新选择Godaddy主机方案美国数据中心教程指导
随着Godaddy官方管理层的变动之后,主营重心已经从当初的域名开始转向到域名和主机产品上.这点我们从其发布域名优惠信息的频率也可以看到,而且我们可以看到常年的主机半价优惠,以及针对主机销售年付方案赠 ...
- RNA -seq
RNA -seq RNA-seq目的.用处::可以帮助我们了解,各种比较条件下,所有基因的表达情况的差异. 比如:正常组织和肿瘤组织的之间的差异:检测药物治疗前后,基因表达的差异:检测发育过程中,不同 ...
- mockjs,json-server一起搭建前端通用的数据模拟框架教程
无论是在工作,还是在业余时间做前端开发的时候,难免出现后端团队还没完成接口的开发,而前端团队却需要实现对应的功能,不要问为什么,这是肯定存在的.本篇文章就是基于此原因而产出的.希望对有这方面的需求的同 ...
- Python爬虫丨大众点评数据爬虫教程(1)
大众点评数据获取 --- 基础版本 大众点评是一款非常受普罗大众喜爱的一个第三方的美食相关的点评网站. 因此,该网站的数据也就非常有价值.优惠,评价数量,好评度等数据也就非常受数据公司的欢迎. 今天就 ...
- .NET 5/.NET Core使用EF Core 5连接MySQL数据库写入/读取数据示例教程
本文首发于<.NET 5/.NET Core使用EF Core 5(Entity Framework Core)连接MySQL数据库写入/读取数据示例教程> 前言 在.NET Core/. ...
- [译]处理文本数据(scikit-learn 教程3)
原文网址:http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html 翻译:Tacey Won ...
- Python爬虫丨大众点评数据爬虫教程(2)
大众点评数据爬虫获取教程 --- [SVG映射版本] 前言: 大众点评是一款非常受大众喜爱的一个第三方的美食相关的点评网站.从网站内可以推荐吃喝玩乐优惠信息,提供美食餐厅.酒店旅游.电影票.家居装修. ...
- hisql orm 框架insert数据写入教程
hisql.net 官网(文档编写中) HiSql 源码(github) https://github.com/tansar/HiSql git clone https://github.com/ta ...
随机推荐
- [转]C#程序性能优化
C#程序性能优化 1.显式注册的EvenHandler要显式注销以避免内存泄漏 将一个成员方法注册到某个对象的事件会造成后者持有前者的引用.在事件注销之前,前者不会被垃圾回收. private v ...
- 【剑指offer】反转链表
输入一个链表,反转链表后,输出新链表的表头. *与之前的问题不同,这里需要修改链表的指向(之前的问题,不需要修改结点的指针,只需使用栈保存每个结点的值) *注意非空处理以及最后一个结点指针的修改 /* ...
- Ubuntu 14.10 下安装Ambari
安装ambari有两种方式,一是自己下载源码编译,另外一个是使用公共仓库 1 使用Public Respositories Step1: Download the Ambari repository ...
- bzoj5047: 空间传送装置
Description 太空中一共有n座星球,它们之间可以通过空间传送装置进行转移.空间传送装置分为m种,第i种装置可以用4个参 数a_i,b_i,c_i,d_i来描述.因为时空抖动的问题,在非整数时 ...
- Linux 本地repo配置
系统版本 centos6.9 配置方法 [local]name=localbaseurl=file:///home/systemimage/gpgcheck=1gpgkey=file:///etc/p ...
- Java笔试面试题整理第五波
转载至:http://blog.csdn.net/shakespeare001/article/details/51321498 作者:山代王(开心阳) 本系列整理Java相关的笔试面试知识点,其他几 ...
- rabbitmq (三) 发布/订阅
rabbitmq的目的并不是让生产者把消息直接发到队列里面去, 这样不能实现解耦的目的,也不利于程序的扩展. 所以就有交换机(exchanges)的概念. 交换机有几种类型:direct, topic ...
- 关于java字节码框架ASM的学习
一.什么是ASM ASM是一个java字节码操纵框架,它能被用来动态生成类或者增强既有类的功能.ASM 可以直接产生二进制 class 文件,也可以在类被加载入 Java 虚拟机之前动态改变类行为 ...
- 作着玩:登录页(纯css,不支持ie9以下)
支持chrome FireFox 和 IE10+,(IE9也能显示,IE9以下不支持) <style type="text/css"> body{position:re ...
- python中的__str__()函数
__str__()函数的作用: 不知道大家再写程序是,打印一个实例化对象时,打印的其实时一个对象的地址.而通过__str__()函数就可以帮助我们打印对象中具体的属性值,或者你想得到的东西. 因为再p ...

