MAGENTA是一款计算工具,利用全基因组遗传数据,计算预先设定的涉及生物过程或者功能性基因集在遗传相关性的富集程度.开发的目的是分析基因型不是现成的数据集,比如大型的全基因组关联荟萃分析.在以下两种情况下可以使用:1,检验某个特定的假设:2,通过检测一系列已知的生物基因集(从不同的公共数据库提供的通路)提出某个假设. 输入文本格式:变体相关的P值和它们的染色体位置(数据从全基因组关联分析文件或者荟萃分析文件获得) 输出文本格式:针对给定的基因集或通路,计算出基因集富集分析后的P值和错误发现率(…
RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析.WGCNA network以及一些没卵用的花式分析.DEG分析是基础,up and down,做个富集,了解一下处理后到底是什么通路被改变了:WGCNA主要就是根据相关性来找出一些co-express的gene module. 单细胞的转录组的玩法就比较多了,可以理解为超多样本的普通转录组,普通转录…
好文献非常难得,提供了核心的研究思路. FTO Obesity Variant Circuitry and Adipocyte Browning in Humans - 这篇文章需要好好的解析 为深入研究一个non-coding variant的作用机制提供了完整的思路 本文宏伟的目标:we sought to identify a causal variant with regulatory roles, its upstream regulator, and its downstream t…
该文献纳入了EGG(Early Growth Genetics Consortium)和UK biobank两大数据库,分为欧洲祖先和非欧洲祖先群体.这两个数据用到的样本量分别如下: Early Growth Genetics Consortium(网址:http://egg-consortium.org/) » 30 studies (European ancestry) N=75,891 » 6 studies (Non-European ancestry), N=10,104 UK Bio…
##Genomic sequence variation ###1000 Genomes Projecthttp://www.1000genomes.org/Data collection and a catalog of human variation ###dbSNPhttp://www.ncbi.nlm.nih.gov/projects/SNP/A catalog ofSNPs and short indels ###dbVar and Database of Genomic Varian…
相关文章: A Unified Framework for Association Analysis with Multiple Related Phenotypes 太重要了,不得不单独拿出来分析一下.本review高度总结了GWAS这10年的成绩.以及现在的局限性.每个搞统计遗传的都必须要好好看看. 第一篇GWAS是什么时候?谁提出的?The first successful GWAS published in 2002 studied myocardial infarction. Ozak…
随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era),向基因的功能及基因的多样性倾斜.通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明不同层次多基因协同作用的机理,进而在人类重大疾病如癌症.心血管疾病的发病机理.诊断治疗.药物开发等方面的研究发挥巨大的作用.它将大大推动人类结构基因组及功能基因组的各项基因组研究计划.生物信息学在基因组…
  image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a priori defined set of genes shows statistically significant, concordant differences between two biological states (e.g. phenotypes). 用GSEA做富集分析是非常简单的,结…
一直都搞不清楚这两者的具体区别. 其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库. 建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别. (抱歉之前没讲清楚,甚至有可能误导大家了) 以下以一个案例来详细说明两者的区别: 推荐一个没有任何基础的人都能使用的gene set注释工具 http://www.webgestalt.org/option.php GCLC TFPI HSPB6 TSPOAP1 ITGA2B OSBPL7 BAIAP2L1 NOS…
1. What is KOBAS 3.0? KOBAS (KEGG Orthology Based Annotation System) is a web server for gene/protein functional annotation (Annotation module) and functional set enrichment (Enrichment module). Given a set of genes or protein, it can determine wheth…