scRNA-seq做完该做的QC、normalization、imputation、clustering、trajectory和integration,就会开始做转录调控的分析了。

核心就是围绕着TF转录因子做文章

  • 预测TF的靶基因
  • 鉴定regulon

大部分都是高通量的预测,准确性有待论证,需要很好的实验验证设计。

预测的工具不要太多:

MARINa — Andrea Califano - paper

SCENIC

什么是regulon

这是一个高通量测序后发明的词,其实就是被同一个调控元件(常见的就是TF)调控的一群基因的集合。

In molecular genetics, a regulon is a group of genes that are regulated as a unit, generally controlled by the same regulatory gene that expresses a protein acting as a repressor or activator.


我们可以从转录调控中看到造物主的影子。

看似简单,就一个中心法则,其实非常复杂,有很多细节。

Transcriptional Regulation and Its Misregulation in Disease 这篇综述必读,但凡是做转录调控的。

基本问题:

分子生物学是如何定义转录调控的?

RNA-seq是如何测出我们基因的表达量的?

基因的表达量与蛋白和代谢的产生量同步吗?

真实的基因表达,半衰期?

我们常规的DEG、GO里到底包含了多少有用的信息?基于不准信息的结果能准确吗?

我们都陷入困境,我们观测了太多的细节,却拼不出一副草图。人类基因组确实一大突破,但却是最简单的突破,天书是有了,怎么解读才是真正费脑的事。

生命科学是观测型科学,一切都是基于观察的,不管是实验还是生信,都是在观察,没有观察就没有知识,很难仅仅通过推理产生新的知识。

基因表达调控包括转录水平、转录后水平和翻译水平。

转录调控是指通过改变转录速率从而改变基因表达的水平,其对遗传信息的传递的准确性和多样性具有重要的作用。真核生物的转录调控包括多种形式,例如DNA甲基化、组蛋白修饰、染色质重塑、转录因子等。

真核生物基因转录在细胞核内进行,而翻译则在细胞质中进行,因此转录后调控是基因表达调控的另一个重要方面,主要包括RNA可变剪接、RNA甲基化以及多种调控RNA(miRNA、lncRNA、circRNA)参与的转录后调控等。

尽管在真核生物中,基因调控主要发生在转录水平,但有些对细胞生存十分重要的蛋白质的合成,其调控也发生在翻译水平。这其中最为重要的几个方面是:mRNA的稳定性,翻译起始调节,翻译相关因子中起始因子的作用以及真核mRNA的结构等。

DNA甲基化:DNA甲基化(英语:DNA methylation)为DNA化学修饰的一种形式,能在不改变DNA序列的前提下,改变遗传表现。DNA甲基化过程会使甲基添加到DNA分子上,例如在胞嘧啶环的5'碳上:这种5'方向的DNA甲基化方式可见于所有脊椎动物。特定胞嘧碇受甲基化的情形,可利用亚硫酸盐定序(bisulfite sequencing)方式测定。DNA甲基化可能使基因沉默化,进而使其失去功能。

组蛋白修饰:组蛋白是与DNA结合的蛋白,它们会对基因的表达产生影响。组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修饰的过程。

染色质重塑:染色质重塑chromatin remodeling :基因表达的复制和重组等过程中,染色质的包装状态、核小体中组蛋白以及对应DNA分子会发生改变的分子机理。

转录因子:转录因子是与DNA特异性结合的一系列蛋白质。结合在DNA上的启动子以及增强子之类控制转录的区域上,促进或者抑制DNA上的遗传信息向RNA转录的过程。转录因子的这一机能可以单独,或者通过与其它蛋白质形成复合体来完成。人类的基因组上已经推定出大约1800个基因控制转录因子的编码。

转录调控太复杂了,但它确实真实存在的,单细胞的基因表达就是由转录调控综合决定的。

现在比较好入手的就是研究转录因子、可变剪切和lncRNA了。

能不能开发一个工具来挖掘这些调控信息,现在的基因表达数据的利用率太低了。

研究转录调控我想知道什么?
1. 在发育过程中,哪些核心的调控因子在调控着发育过程?
2. 在致病过程中,哪些核心的调控因子的失调导致了疾病?

基于pathway or genelist的NN模式识别,或者预测。
lncRNA与single cell的挖掘
到底是哪些因素在控制基因的表达调控

能不能开发出超越聚类的单细胞分析方法?

我的数据到底可以研究什么,不能研究什么?

组织、器官都是由单细胞组成的,单细胞内某一刻的基因表达是转录调控的结果,现在我们想知道生物体内的转录调控在发育和致病过程中是如何自发进行的!!!
trigger

https://github.com/slowkow/tftargets

human transcription factor download
transcription factor single cell
lncRNA target gene

转录调控 | Transcriptional Regulation | Regulon的更多相关文章

  1. 转录调控实战 | 一文解决转录调控问题 | chIP-seq | ATAC-seq

    做生物的想发文章怎么办?转录调控来解析(huyou)! 最简单的情形: 1. 我在研究一个非常重要的基因A,功能已经做得差不多了,现在想深挖,第一步就是想知道哪个转录因子调控这个基因A: 2. 我发现 ...

  2. MIT Molecular Biology 笔记6 转录的调控

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  3. (基因功能 & 基因表达调控)研究方案

    做了好久的RNA-seq分析,基因表达也在口头溜了几年了,但似乎老是浮在表面. 对一件事的了解程度决定了你的思维深度,只想做技工就不用想太多,想做大师就一定要刨根问底. 老是说基因表达,那么什么是基因 ...

  4. 基因调控网络 (Gene Regulatory Network) 01

    本文为入门级的基因调控网络文章,主要介绍一些基本概念及常见的GRN模型. 概念:基因调控网络 (Gene Regulatory Network, GRN),简称调控网络,指细胞内或一个基因组内基因和基 ...

  5. lncRNA研究

    ------------------------------- Long noncoding RNAs are rarely translated in two human cell lines. ( ...

  6. 文献阅读 | Resetting histone modifications during human parental-to-zygotic transition

    Resetting histone modifications during human parental-to-zygotic transition 人类亲本-合子转变中组蛋白修饰重编程 sci-h ...

  7. Enhancer | 增强子 专题

    要做就做深做精! Everything needs good justification. The interpretation should be biologically and statisti ...

  8. 什么是侧翼区(flanking region)和侧翼区单核苷酸多态性(Flanking SNPs)

    侧翼区(flanking region) 根据维基定义:The 5' flanking region is a region of DNA that is adjacent to the 5' end ...

  9. HOMER | MEME | 转录因子的靶基因预测

    Finding Enriched Motifs in Genomic Regions (findMotifsGenome.pl) 在指定区域做motif enrichment,大大降低了假阳性. ME ...

随机推荐

  1. mysql主从部署

    一.安装环境 1.系统环境 系统 IP 主机名 说明 server_id centos6.7 192.168.0.173 master 数据库:主 173  centos6.7 192.168.0.1 ...

  2. dubbo API的使用方式

    本文使用maven方式 1:pom文件 <dependencies> <!-- 引入spring的jar --> <dependency> <groupId& ...

  3. Linux动态连接器

    转自:Chapter 9. Dynamic Linking 参考:Linux动态链接器 Linux加载启动可执行程序的过程(一)内核空间加载ELF的过程 Linux加载启动可执行程序的过程(二)解释器 ...

  4. DNS服务——智能域名解析、镜像Web站点、直接域名泛域名

    智能域名解析 智能域名解析只有Linux DNS服务器才有.下面给出2种智能域名解析应用场景. 应用场景1 整个互联网由众多ISP组成,在中国就是联通.电信.移动等等 各家ISP内部网络四通八达,速度 ...

  5. mybatis遍历map

    mytabis是可以遍历map的,试过很多其他的方法都不行,最终使用如下方法是可以的: 1.mapper.java如下(注意要加@Param注解,否则不行,我就在这里折腾了不少时间): int upd ...

  6. 实例演示MaxTenuringThreshold参数及阈值动态调整策略

    在上一次[https://www.cnblogs.com/webor2006/p/11031563.html]学习了一个新的JVM对象晋升到老年代的参数“MaxTenuringThreshold”,它 ...

  7. linux网络编程之socket编程(六)

    经过一个国庆长假,又有一段时间没有写博文了,今天继续对linux网络编程进行学习,如今的北京又全面进入雾霾天气了,让我突然想到了一句名句:“真爱生活,珍惜生命”,好了,言归正传. 回顾一下我们之间实现 ...

  8. linux网络编程之posix条件变量

    今天来学习posix的最后一个相关知识----条件变量,言归正传. 下面用一个图来进一步描述条件变量的作用: 为什么呢? 这实际上可以解决生产者与消费者问题,而且对于缓冲区是无界的是一种比较理解的解决 ...

  9. 大数据之路week06--day07(Hadoop常用命令)

    一.前述 分享一篇hadoop的常用命令的总结,将常用的Hadoop命令总结如下. 二.具体 1.启动hadoop所有进程start-all.sh等价于start-dfs.sh + start-yar ...

  10. ADB命令使用详解

    ADB是一个 客户端-服务器端 程序, 其中客户端是你用来操作的电脑, 服务器端是android设备. 1.连接android设置 adb connect 设备名 例如: adb connect 12 ...