【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
期刊:Nature Genetics
影响因子:29.352
一、研究背景
以青蒿素为主的联合疗法一直以来都是治疗疟疾的有效方法,值得关注的是横跨亚洲到非洲都出现了对一线药物的抗药性。阻止出现更高水平的抗药性以及阻止抗药性扩散到非洲刻不容缓。为了更好同抗药性进行斗争,了解遗传因素在抗药性的混合和传播中的作用非常重要。
二、材料
选取来自柬埔寨、越南、老挝、缅甸、孟加拉国、刚果和尼日利亚的13个地方的疟原虫样本1063(取自血液如下图)。
三、测序
Illumina测序平台。
paired-end sequencing reads of 200–300bp
1Gb of read data per sample
四:研究结果
1)Manhattan plot
没有意义的SNP的都是圆点,有意义的都是菱形的,处于中间有意义的点,要比没有意义的点大。
其中这些SNP关联的基因如下:
2)构建系统进化树,种群结构主要分为三个部分:
3)选择清楚分析
五数据分析
1)使用bwa进行比对
2)call snp使用的是samtools,总共得到3,373,632 SNP
3)生成的snp list使用SNP-o-matic algorithm 进行realignment 减少错误比对
(http://www.sanger.ac.uk/science/tools/snp-o-matic)
4)SNP过滤:
noncoding SNPs;
SNPs where polymorphisms had extremely low support (<10 reads in 1 sample);
SNPs with more than 2 alleles, with the exception of loci known to be important for drug resistance, which were manually verified to not have artifacts;
SNPs where coverage across samples was lower than the 25th percentile or higher than the 95th percentile of
(v) SNPs located in regions of relatively low uniqueness;
(vi) SNPs where heterozygosity levels were found to be inconsistent with the heterozygosity distribution at the SNP’s allele frequency;
(vii) SNPs where the genotype could not be established in at least 70% of samples.
5)关联分析使用:FaST-LMM v2.06 (因为样本多)
6)样本间关系矩阵计算使用snp的一个子集,主要是排除SNP当中的连锁的SNP,使用plink软件,参数为:–indep-pairwise 100 10 0.3 –maf 0.01
a) consider a window of 100 SNPs, b) calculate LD between each pair of SNPs in the window, b) remove one of a pair of SNPs if the LD is greater than 0.3, c) shift the window 10 SNPs forward and repeat the procedure.
(http://pngu.mgh.harvard.edu/~purcell/plink/summary.shtml#prune)
原文:http://blog.sina.com.cn/s/blog_83f77c940102w2wg.html
【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析的更多相关文章
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
- GWAS 全基因组关联分析 | summary statistic 概括统计 | meta-analysis 综合分析
有很多概念需要明确区分: 人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男. 染色体区带命名:在标示一特定的带时需要包括4项:① ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...
- 一行命令学会全基因组关联分析(GWAS)的meta分析
为什么需要做meta分析 群体分层是GWAS研究中一个比较常见的假阳性来源. 也就是说,如果数据存在群体分层,却不加以控制,那么很容易得到一堆假阳性位点. 当群体出现分层时,常规手段就是将分层的群体独 ...
- 全基因组关联分析(GWAS):为何我的QQ图那么飘
前段时间有位小可爱问我,为什么她的QQ图特别飘,如果你不理解怎样算飘,请看下图: 理想的QQ图应该是这样的: 我当时的第一反应是:1)群体分层造成的:2)表型分布有问题.因此让她检查一下数据的群体分层 ...
- 全基因组关联分析(GWAS)扫不出信号怎么办(文献解读)
假如你的GWAS结果出现如下图的时候,怎么办呢?GWAS没有如预期般的扫出完美的显著信号,也就没法继续发挥后续研究的套路了. 最近,nature发表了一篇文献“Common genetic varia ...
- R语言画全基因组关联分析中的曼哈顿图(manhattan plot)
1.在linux中安装好R 2.准备好画曼哈顿图的R脚本即manhattan.r,manhattan.r内容如下: #!/usr/bin/Rscript #example : Rscript plot ...
- 全基因组关联分析学习资料(GWAS tutorial)
前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习 ...
随机推荐
- Linux常用命令(二)
2.2.其他权限管理命令 命令名称:chown 功能:更改文件目录或文件的所有者语法:chown[用户][文件或目录]命令名称:chgrp 功能:改变文件或目录的所属组语法:chgrp[用户][文件或 ...
- Qt——设计颜色编辑器
Qt中有一些封装好的对话框,比如QMessageBox.QColorDialog等,用途很广,但缺点是样式难以改变,直接拿来用可能与我们自己的系统样式不搭配,显得很难看. 所以我在无聊的时候,就自己写 ...
- Win7下mysql root账户登录提示:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)解决方案
ERROR 1045 (28000): Ac-- password: YES)这个意思是密码不正确,那就修改密码: 如果你是服务器是 windows xp/2000/2003/nt 都可以使用这个方法 ...
- hibernate与ibatis比较
hibernate 是当前最流行的o/r mapping框架,它出身于sf.net,现在已经成为jboss的一部分了. ibatis 是另外一种优秀的o/r mapping框架,目前属于apache的 ...
- asp.net mvc HandleErrorAttribute 异常错误处理 无效!
系统未知bug,代码没有深究. 现象:filters.Add(new HandleErrorAttribute()); 使用了全局的异常处理过滤. HandleErrorAttribute 核心代码: ...
- C#算法知识点记录
针对算法的知识点进行记录 简易桶排序 首先看一个简易桶排序,有一串数字,进行从大到小排列.数字间隔不大,使用一维数组来当作桶,进行插入排序. static void Main(string[] arg ...
- bzoj4571: [Scoi2016]美味
4571: [Scoi2016]美味 Time Limit: 30 Sec Memory Limit: 256 MB Submit: 275 Solved: 141 [Submit][Status][ ...
- <!DOCTYPE html>作用
1.定义: DOCTYPE标签是一种标准通用标记语言的文档类型声明,它的目的是要告诉标准通用标记语言解析器,它应该使用什么样的文档类型定义(DTD)来解析文档. <!DOCTYPE> 声明 ...
- CSS-学习笔记一
CSS(层叠样式表)做网页的外观 四种样式: 权重: 行内样式>内嵌式>链接式 1. 行内样式 <div style="color:red;font-size:30px&q ...
- myBatis foreach详解【转】
MyBatis的foreach语句详解 foreach的主要用在构建in条件中,它可以在SQL语句中进行迭代一个集合.foreach元素的属性主要有 item,index,collection,ope ...