文献笔记:Genome-wide associations for birth weight and correlations with adult disease
该文献纳入了EGG(Early Growth Genetics Consortium)和UK biobank两大数据库,分为欧洲祖先和非欧洲祖先群体。这两个数据用到的样本量分别如下:
Early Growth Genetics Consortium(网址:http://egg-consortium.org/)
» 30 studies (European ancestry)
N=75,891
» 6 studies (Non-European ancestry),
N=10,104
UK BioBank(网址: http://www.ukbiobank.ac.uk/)
» 1 study (European ancestry)
N=67,786
整个分析流程如下图:

对于GWAS大样本量研究来说,该文献可借鉴的研究思路有以下几个:
1、先把GWAS和QQ plot画出来

Manhattan and quantile–quantile (QQ) plots of the trans-ancestry meta-analysis for BW
2、将不同群体做一个meta分析

Sixty loci associated with BW (P<5×10−8) in European ancestry meta-analysis of up to 143,677 individuals and/or trans-ancestry meta-analysis of up to 153,781 individuals. 53 of these loci were novel and seven previously reported BW signals.
3、计算显著信号的SNP的效应值(effect size)

The effect of the lead SNP (absolute value of β, y axis) is given as a function of minor allele frequency (x axis) for 60 known (pink) and novel (green) BW loci from the trans-ancestry meta-analysis.
4、近似条件分析(Approximate conditional analysis)

Loci with multiple distinct association signals attaining genome-wide significance (P<5x10-8) in approximate conditional meta-analysis of 143,677 individuals of European ancestry, using 5,000 white British participants from UK BioBank as a reference for linkage disequilibrium.
5、计算母体和胎儿基因型对表型的影响(Effects on phenotypes of maternal and fetal genotype)
此分析针对有母亲和婴儿的基因型数据

Comparison of fetal effect sizes and maternal effect sizes at 60 known and novel birth weight loci, for the first 24 loci
6、连锁不平衡得分回归分析(Linkage-disequilibrium score regression)

Genome-wide genetic correlation between BW and a range of traits and diseases in later life.
7、基因集富集分析(Gene set enrichment analysis)

8、与表型相关位点的层次聚类分析(Hierarchical clustering)

9、蛋白质相互作用网络分析(Protein–protein interaction network analyses)

10、接触点分析(Point of contact analyses)

总结:只要有大样本量,GWAS想怎么玩转就怎么玩转,高分文章都不在话下。但问题就是,很多人都卡在了大样本量这一步了,这也是后面的分析玩不开的原因。信号都没有,何谈各种互作分析。
文献笔记:Genome-wide associations for birth weight and correlations with adult disease的更多相关文章
- image-to-image translation with conditional adversarial networks文献笔记
Image-to-Image Translation with Conditional Adversarial Networks (基于条件gan的图像转图像) 作者:Phillip Isola, J ...
- 《More Accurate Question Answering on Freebase》文献笔记
bast-2015-CIKM CIKM全称是International Conference on Information and Knowledge Management 这篇文章主要采用采用lea ...
- GWAS分析基本流程及分析思路
数据预处理(DNA genotyping.Quality control.Imputation) QC的工作可以做PLINK上完成Imputation的工作用IMPUTE2完成 2. 表型数据统计分析 ...
- GWAS Catalog数据库简介
GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS ...
- 相关系数(CORRELATION COEFFICIENTS)会骗人?
CORRELATION COEFFICIENTS We've discussed how to summarize a single variable. The next question is ho ...
- GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...
- 全基因组关联分析学习资料(GWAS tutorial)
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习 ...
- GWAS 全基因组关联分析 | summary statistic 概括统计 | meta-analysis 综合分析
有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:① ...
- GWAS
GWAS的数据形式:SNP数据,即各个SNP位点的aa,Aa,AA基因型与疾病状态(0正常,1患病)的样例-对照数据. 在遗传流行病学上,全基因组关联研究(Genome Wide Associatio ...
随机推荐
- Window上安装—Docker 笔记
本文转自:http://cnodejs.org/topic/55a24267419f1e8a23a64367 需求 想玩nodeClub 源码跑起来,结果window 上各种报错,各种依赖软件要装的感 ...
- python学习笔记(11)--文件与数据格式化
文件的概念: 文件是数据的抽象和集合,是存储在辅助存储器上的数据序列,文件是数据存储的一种形式,文件的展现形态,文本文件和二进制文件. 文本文件输出: f.txt文件保存:“我是中国人” >&g ...
- 阿里p3c(代码规范,eclipse插件、模版,idea插件)
阿里p3c 一.说明 代码规范检查插件p3c,是根据<阿里巴巴Java开发手册>转化而成的自动化插件. (高级黑:P-3C“Orion”,反潜巡逻机,阿里大概取p3c先进,监测,发现潜在问 ...
- C# json解析
json格式数 [{ , , , "ItemCode": "UBAC11211OF-A54", "basicName_bg": " ...
- oracle NVL与Coalesce的区别
先来说一下用法上的区别 : nvl(COMMISSION_PCT,0)如果第一个参数为null,则返回第二个参数如果第一个参数为非null,则返回第一个参数 COALESCE(EXPR1,EXPR2, ...
- [oracle] to_date() 与 to_char() 日期和字符串转换
to_date("要转换的字符串","转换的格式") 两个参数的格式必须匹配,否则会报错. 即按照第二个参数的格式解释第一个参数. to_char(日期,& ...
- ACM之路——上车了
校赛坚持到底,拿到了银牌:第一批进入ACM队集训,期末考试之前仍然代码不断,甚至感觉对不起大学第一次的期末考试,五天复习高数,两天复习英语,看到英语成绩是胸口突然好痛,好难受……就为了成为ACM正式队 ...
- 【深入Java虚拟机】之一:Java内存模型
[深入Java虚拟机]之:Java内存区域与内存溢出 内存区域 Java虚拟机在执行Java程序的过程中会把他所管理的内存划分为若干个不同的数据区域.Java虚拟机规范将JVM所管理的内存分为以下几个 ...
- iptables防火墙的原理及应用
简介 (netfilter, 位于Linux内核中的包过滤功能体系 ,称为Linux防火墙的“内核态”) iptables防火墙工作在网络层,针对TCP/IP数据包实施过滤和限制,iptables防 ...
- BZOJ1430小猴打架——prufer序列
题目描述 一开始森林里面有N只互不相识的小猴子,它们经常打架,但打架的双方都必须不是好朋友.每次打完架后,打架 的双方以及它们的好朋友就会互相认识,成为好朋友.经过N-1次打架之后,整个森林的小猴都会 ...