【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
期刊:Nature Genetics
影响因子:29.352
一、研究背景
以青蒿素为主的联合疗法一直以来都是治疗疟疾的有效方法,值得关注的是横跨亚洲到非洲都出现了对一线药物的抗药性。阻止出现更高水平的抗药性以及阻止抗药性扩散到非洲刻不容缓。为了更好同抗药性进行斗争,了解遗传因素在抗药性的混合和传播中的作用非常重要。
二、材料
选取来自柬埔寨、越南、老挝、缅甸、孟加拉国、刚果和尼日利亚的13个地方的疟原虫样本1063(取自血液如下图)。
三、测序
Illumina测序平台。
paired-end sequencing reads of 200–300bp
1Gb of read data per sample
四:研究结果
1)Manhattan plot
没有意义的SNP的都是圆点,有意义的都是菱形的,处于中间有意义的点,要比没有意义的点大。
其中这些SNP关联的基因如下:
2)构建系统进化树,种群结构主要分为三个部分:
3)选择清楚分析
五数据分析
1)使用bwa进行比对
2)call snp使用的是samtools,总共得到3,373,632 SNP
3)生成的snp list使用SNP-o-matic algorithm 进行realignment 减少错误比对
(http://www.sanger.ac.uk/science/tools/snp-o-matic)
4)SNP过滤:
noncoding SNPs;
SNPs where polymorphisms had extremely low support (<10 reads in 1 sample);
SNPs with more than 2 alleles, with the exception of loci known to be important for drug resistance, which were manually verified to not have artifacts;
SNPs where coverage across samples was lower than the 25th percentile or higher than the 95th percentile of
(v) SNPs located in regions of relatively low uniqueness;
(vi) SNPs where heterozygosity levels were found to be inconsistent with the heterozygosity distribution at the SNP’s allele frequency;
(vii) SNPs where the genotype could not be established in at least 70% of samples.
5)关联分析使用:FaST-LMM v2.06 (因为样本多)
6)样本间关系矩阵计算使用snp的一个子集,主要是排除SNP当中的连锁的SNP,使用plink软件,参数为:–indep-pairwise 100 10 0.3 –maf 0.01
a) consider a window of 100 SNPs, b) calculate LD between each pair of SNPs in the window, b) remove one of a pair of SNPs if the LD is greater than 0.3, c) shift the window 10 SNPs forward and repeat the procedure.
(http://pngu.mgh.harvard.edu/~purcell/plink/summary.shtml#prune)
原文:http://blog.sina.com.cn/s/blog_83f77c940102w2wg.html
【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析的更多相关文章
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
- GWAS 全基因组关联分析 | summary statistic 概括统计 | meta-analysis 综合分析
有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:① ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...
- 一行命令学会全基因组关联分析(GWAS)的meta分析
为什么需要做meta分析 群体分层是GWAS研究中一个比较常见的假阳性来源. 也就是说,如果数据存在群体分层,却不加以控制,那么很容易得到一堆假阳性位点. 当群体出现分层时,常规手段就是将分层的群体独 ...
- 全基因组关联分析(GWAS):为何我的QQ图那么飘
前段时间有位小可爱问我,为什么她的QQ图特别飘,如果你不理解怎样算飘,请看下图: 理想的QQ图应该是这样的: 我当时的第一反应是:1)群体分层造成的:2)表型分布有问题.因此让她检查一下数据的群体分层 ...
- 全基因组关联分析(GWAS)扫不出信号怎么办(文献解读)
假如你的GWAS结果出现如下图的时候,怎么办呢?GWAS没有如预期般的扫出完美的显著信号,也就没法继续发挥后续研究的套路了. 最近,nature发表了一篇文献“Common genetic varia ...
- R语言画全基因组关联分析中的曼哈顿图(manhattan plot)
1.在linux中安装好R 2.准备好画曼哈顿图的R脚本即manhattan.r,manhattan.r内容如下: #!/usr/bin/Rscript #example : Rscript plot ...
- 全基因组关联分析学习资料(GWAS tutorial)
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习 ...
随机推荐
- SqlMetal生成的DBML文件信息
[Database(Name="AdventureWorks")] --> 映射数据库 [Table(Name="Customers")] --> ...
- SharePoint 2013技巧分享系列 - Active Directory同步显示用户照片
为了保持通讯信息的一致性,需要设置SharePoint,Exchange, Lync等信息同步更新显示,例如,员工头像信息. 本文介绍如何在SharePoint 2013中同步显示Active Dir ...
- ssh远程执行目标机器上的命令
一句话: ssh -t -p 端口号 用户名@远程机器IP '远程机器上的命令完整路径' 例如: ssh -t -p 22 yangjunming@dev '/opt/app/deploy.sh' 注 ...
- 20145208《信息安全系统设计基础》实验五 简单嵌入式WEB 服务器实验
20145208<信息安全系统设计基础>实验五 简单嵌入式WEB 服务器实验 20145208<信息安全系统设计基础>实验五 简单嵌入式WEB 服务器实验
- Java面试题总结(二)
43.Java中的两种异常类型是什么?他们有什么区别? Java中有两种异常:受检查的(checked)异常和不受检查的(unchecked)异常.不受检查的异常不需要在方法或者是构造函数上声明,就算 ...
- JBPM4.4业务流程管理框架详细解读
1. 什么是JBPM4.4业务流程管理框架? JBPM,全称是JavaBusiness Process Management(业务流程管理),它是覆盖了业务流程管理.工作流.服务协作等领域的一个开源的 ...
- HttpResponse的使用方法
HttpResponse的使用方法: HttpRequest类是一个封闭HTTP提交信息的类型,而封闭HTTP输出信息的类型就是HttpResponse类,使用HttpResponse类可以实现三种类 ...
- [Think In Java]基础拾遗1 - 对象初始化、垃圾回收器、继承、组合、代理、接口、抽象类
目录 第一章 对象导论第二章 一切都是对象第三章 操作符第四章 控制执行流程第五章 初始化与清理第六章 访问权限控制第七章 复用类第九章 接口 第一章 对象导论 1. 对象的数据位于何处? 有两种方式 ...
- 【poj2065】 SETI
http://poj.org/problem?id=2065 (题目链接) 题意 题意半天看不懂..给你一个素数P(P<=30000)和一串长为n的字符串str[].字母'*'代表0,字母a-z ...
- iOS获取设备唯一标识的8种方法
8种iOS获取设备唯一标识的方法,希望对大家有用. UDID UDID(Unique Device Identifier),iOS 设备的唯一识别码,是一个40位十六进制序列(越狱的设备通过某些工具可 ...