scRNA-seq做完该做的QC.normalization.imputation.clustering.trajectory和integration,就会开始做转录调控的分析了. 核心就是围绕着TF转录因子做文章 预测TF的靶基因 鉴定regulon 大部分都是高通量的预测,准确性有待论证,需要很好的实验验证设计. 预测的工具不要太多: MARINa — Andrea Califano - paper SCENIC 什么是regulon? 这是一个高通量测序后发明的词,其实就是被同一个调控元件…
做生物的想发文章怎么办?转录调控来解析(huyou)! 最简单的情形: 1. 我在研究一个非常重要的基因A,功能已经做得差不多了,现在想深挖,第一步就是想知道哪个转录因子调控这个基因A: 2. 我发现了一个新颖的转录因子B,非常想知道这个TF到底在调控哪个基因. 研究方法不过几种: 1. RNA-seq分析差异基因,间接推测调控的转录因子. 2. 基于大量的ChIP-seq公共数据挖掘,用TF的抗体抓TF,同时抓下来TF结合的DNA,提取DNA,测序,就知道TF结合了哪些DNA,推测DNA附近的…
视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular biology of the gene 7th edition  J.D. Watson et. al 转录的调控 原核生物的转录调控 一.转录调控原理 1.基因表达由调控蛋白控制 激活因子 activator 抑制因子 repressor 它们通常都是DNA结合蛋白 2.大多数的激活因子和抑制因子在转录起…
做了好久的RNA-seq分析,基因表达也在口头溜了几年了,但似乎老是浮在表面. 对一件事的了解程度决定了你的思维深度,只想做技工就不用想太多,想做大师就一定要刨根问底. 老是说基因表达,那么什么是基因表达?我们测序得到的基因表达其实只是一种表型,是样本的一个快照,和普通的身高体重之类的连续型表型类似. 常规的转录组分析本质上都是表型分析,clustering.pseudotime.DEG.marker,在这些分析中,每个基因都是独立的维度,属于静态的分析,此时我们关注的是某个基因的功能分析,比如…
本文为入门级的基因调控网络文章,主要介绍一些基本概念及常见的GRN模型. 概念:基因调控网络 (Gene Regulatory Network, GRN),简称调控网络,指细胞内或一个基因组内基因和基因之间的相互作用关系形成的网络,特指基因调控 (gene regulation) 导致基因之间的作用.GRN是生物体内控制基因表达的机制,基因表达的主要过程是转录+翻译 GRN构建方法:多数方法使用静态数据来分析基因网络,如基因表达矩阵,该矩阵是一个时刻的基因表达情况.实际上,我们需要考虑动态网络,…
------------------------------- Long noncoding RNAs are rarely translated in two human cell lines. (蛋白,多肽) Bánfai B, Jia H, Khatun J, Wood E, Risk B, Gundling WE Jr, Kundaje A, Gunawardena HP, Yu Y, Xie L, Krajewski K, Strahl BD, Chen X, Bickel P, Gi…
Resetting histone modifications during human parental-to-zygotic transition 人类亲本-合子转变中组蛋白修饰重编程 sci-hub MARINa (MAster Regulator INference algorithm) MARINaMARINA (Master Regulator Inference Algorithm) MAster Regulator INference algorithm (MARINa), de…
要做就做深做精! Everything needs good justification. The interpretation should be biologically and statistically sound. shit 做生信,等级确实是真实存在的,初级的就是没有什么想法,别人做什么我模仿着做一下,就是科技服务大部分的客户:中级的就是一个新东西出来了,我正好去抢某个点,典型的就是某些数据库,eRNA出来了,我就去数据挖掘搞个数据库:高级的就是会讲故事的,想法很好,能不断创新,对科…
侧翼区(flanking region) 根据维基定义:The 5' flanking region is a region of DNA that is adjacent to the 5' end of the gene. The 5' flanking region contains the promoter, and may contain enhancers or other protein binding sites. It is the region of DNA that is…
Finding Enriched Motifs in Genomic Regions (findMotifsGenome.pl) 在指定区域做motif enrichment,大大降低了假阳性. MEME也可以做,但是设定更加复杂. 转录因子的表达具有高度的组织特异性,而且已知的TF只有1000多个,基因有30000多个,所以一个TF的靶基因可能有几百个,而且具有高度的时空组织特异性. 实验的方法就不说了,可靠.成本高.耗费劳力. 以下只说高通量数据的预测方法. 最简单的预测就是基于基因表达,c…