本文利用99085个高质量SNP 通过STRUCTURE,PCA和neighbour-joining tree的群体结构分析将地方品种分为三个亚群,这些亚群表现出地理上的遗传分化。利用纬度相差10°的两个位置(北京、武汉)收集的表型数据,鉴定了17个与开花时间性状相关的SNP(TAS),包括一个稳定的基因位点Chr12:5914898和以前未检测到的在开花基因E1和E2附近的候选基因。利用与地方种收集地点相关的已公布数据,鉴定出与三个生物气候学变量(温度,日长和降水)相关的27个SNP。在12个生物气候TASs的连锁不平衡(LD)区域内检测到一系列候选开花基因。其中9个TASs在开花时间上表现出显著差异。在44个开花和生物气候TASs中,有38个检测到了驯化、地方品种多样化和适应过程中的选择信号。

材料与方法

测序材料:2368个种质材料,包括112个野生种(选自中韩俄日,代表广泛的生态地理范围),和2256个地方种(可代表核心种质的表型多样性和地理分布的中国主要的地方种)

测序平台:Life Technologies’ Ion Proton Systems

数据量:0.75T

筛选后的97个野生种和1938个地方品种(地方种据其地理分布及种植季节类型分为7类);414个核心地方种质

开花时间表型鉴定材料:2256个地方种,分别种于7月武汉(30.5°N, 114.3°E)、6月北京(40.1°N, 116.7°E),各两次重复;414份核心种质种于广西(2009-2011年)的南宁(7月中),北京(2011-2012)的昌平(5月初,春季型)、顺义(6月末,夏季型),三年2~3次重复。

地理和气候变量:利用已知数据获得不同品种的经纬度及海拔的坐标,利用坐标在生物气候网站BioClim (http://www.worldclim.org/bioclim,version 1.4)查询其对应的生物气候变量:年温度变化范围(TAR)及年降水量(AP),最大日光长度(MDL)的计量以表型鉴定为准。

群体结构分析方法

群体结构:软件STRUCTURE

Neighbor-joining tree:APE(V3.2)

PCA:PLINK(V1.9)

Qst-Fst比较:Pstat (V1.2)

LD:PLINK (V1.9)

参考基因组:*Glycine max *Wm82.a2.v1

图1 不同基因型种质的地理分布和大豆基因组的特性。

A:7种生态型:东北春季型(NESp),北方春季型(NSp),黄淮春季型(HSp),黄淮夏季型(HSu),南方春季型(SSp),南方夏季型(SSu) )和南方秋季型(SAu)。

B:20条大豆染色体上共获得99085个SNP。最外圈:大豆20条染色体,灰色为染色体杂合区域,黑色为染色体臂。a:基因密度 b:SNP密度 c-f依次为:野生种、SR、HR、NR的遗传多样性。

结果分析

多态性、群体结构和多样性

对2035个种质材料进行群体结构分析,共鉴定出1类野生型(wild),三类地方种的亚群(北方种NR,黄淮种HR,南方种SR),和一类混合基因组种质(mixed)。对群体分化程度的鉴定表明,虽然地方种比野生种的数量大20倍,但地方种仍比野生种存在更多的LD(图2D), SNPs更少,多样性也更少(表S5)。选择性清除分析(Fst)的比较结果表明HR和SR之间遗传分化程度最大(0.164),其次是NR与SR(0.136),NR与HR之间差异最小(0.077)。

图2群体结构和连锁不平衡分析

A:样本按生态类型和采集地点的纬度排列

B:对1938个地方种和97个野生种的群体结构分析(K=4)

C:根据99085个SNPs对2035个种质的PCA分析

D:LD衰减距离,landrace代表混合地方种

生物气候变量和开花时间的变化

不同地理位置上开花时间与生物气候变量呈现显著的相关性(图S4),两个地方的每个种质的开花时间也显著相关(图S5)。这些结果表明,虽然可以根据环境因素(不同地点)推测其开花时间,但是同一地点的不同品种间开花时间应主要受遗传因素控制。

图s4 北京和武汉不同气候变量与开花时间的相关性比较

图s5 北京和武汉三个大豆地方种群开花时间的变化

开花时间的GWAS分析

利用GWAS鉴定与开花时间相关的基因,共关联到18个相关位点,代表17个TASs,同时在武汉和北京的Chr12:5914898位置关联到同一个位点。对414份核心种质材料在其余三个地点的GWAS分析,进一步验证了该结果。

图3 地方种开花时间性状相关位点(TASs)的鉴定分析

ABEFG:五个地点开花时间的GWAS分析的曼哈顿图,北京、武汉所用材料为1938个地方种,昌平、顺义、南宁三个地点所用材料为414个核心种质。

灰色水平线表示1%阈值线

红色垂直线表示两个克隆的开花时间基因E1E2的基因组位置。

CDHIJ:每个地方种携带早开花位点的TASs数量与开花时间的相关性

生物气候因素的GWAS分析

文中利用GWAS分析鉴定了与三个生物气候变量(温度/TAR,日长/MDL,降水/AP)的适应性相关的基因座,共鉴定到29个显著关联位点,对应27个独特的TASs(图S9)。其中两个SNPs(Chr02:6487107和Chr15:23361474)均分别与MDL和TAR相关。

图s9 大豆地方种与生物气候因素相关的GWAS分析

大豆驯化过程中选择信号的检测以及适应过程中地方品种的多样化

研究比较了地方种和野生种之间的Fst和等位基因频率比较,评估了这些生物气候TASs和开花时间的遗传分化间的关系。17个开花时间TASs和27个生物气候TASs的大部分均在驯化过程中存在强选择。在44个TASs中,有11个同时在驯化、地方种多样化和适应性中经历了选择,有3个仅在驯化过程中经历了选择,24个仅在地方种多样化和适应性中经历了选择,有6个没有表现出被选择。这些分析结果说明了自然和人工选择对特定环境适应性的作用及生物气候变量对大豆地方种之间遗传变异模式的影响。

开花候选基因/QTL的鉴定

E1E2基因是已知影响开花的基因。文中鉴定到的三个TASs(Chr06:19873100,Chr06:20003061和Chr06:20355903)位于Chr06上E1基因附近,且对开花时间的影响不同,在不同的地区表现出不同的表型变异,其地理分布也表现出不同的模式。说明在E1附近可能存在一个或多个以前未检测到的开花时间相关基因。

在E2基因附近检测到两个强关联位点Chr10:45520960和Chr10:45521328,通过对携带不同基因型的不同亚群之间表型鉴定,检测到开花时间的显著差异,表明Glyma.10G224500是开花时间的相关候选基因。

利用北京和武汉两地点的实测开花时间数据,通过GWAS鉴定了第12号染色体上的两个开花时间TASs(Chr12:5470311和Chr12:5914898)。Chr12:5470311位点与拟南芥开花基因同源且与一开花时间相关TAS连锁;Chr12:5914898位于编码Cyclic Nucleotide-gated Ion Channel 15-Related蛋白的基因Glyma.12G076800的内含子上;经表型(图4C,D)及Fst和等位基因频率分析鉴定(图4E)表明两位点均参与了开花时间的调控。

图4 开花时间位点Chr12:5470311和Chr12:5914898的鉴定

转自:文献解读|大豆品种适应性位点鉴定的GWAS分析方法

【豆科基因组】大豆适应性位点GWAS分析 [转载]的更多相关文章

  1. 【豆科基因组】绿豆Mungbean, Vigna radiata基因组2014NC

    目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SN ...

  2. 【豆科基因组】大豆(Soybean, Glycine max)经典文章梳理2010-2020

    目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechn ...

  3. 【豆科基因组】普通豆/菜豆/四季豆Common bean (Phaseolus vulgaris L.) 基因组

    目录 研究一:G19833组装,2014NG 研究二:BAT 93组装,2016 genome biology 菜豆属(Phaseolus L.)为同源二倍体作物,包含有80 多个物种,多数为野生种, ...

  4. GWAS+自然选择:62个样本的GWAS分析,没信号,如何巧妙的发文章

    欢迎来到"bio生物信息"的世界 6天前,BMC Genomics 推了一篇文献"Population history and genetic adaptation of ...

  5. GWAS分析结果中pvalue/p.ajust为0时如何处理?

    在GWAS分析的结果中,偶尔会遇到到pvalue为0的SNP位点,这时如果直接做曼哈顿或QQ图,会出错,因为log0无意义. 此时,该如何处理? 如果你用的是Plink1.9来做的GWAS,可加一个参 ...

  6. 【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell

    目录 一.前沿概述 二.主要结果 重测序.组装与注释 泛基因组 SV特征 PAV与古多倍化,WGD事件 基因SV与基因融合 SV与大豆驯化 SV影响基因表达及其与性状关联 一.前沿概述 Pan-Gen ...

  7. 【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC

    目录 一.来源 二.结果 扁豆的染色体水平高质量组装 扁豆相关农艺性状的QTL定位 直系/旁系同源的演化和物种形成事件 与农艺性状相关基因的直系同源物 群体结构分析揭示扁豆遗传簇 豆荚发育过程中的基因 ...

  8. 【豆科基因组】豇豆Cowpea,Vigna unguiculata [L.] Walp.基因组2019PJ

    目录 来源 结果 基因组大小估计 采用stitching方法组装 修改豇豆染色体编号 基因注释和重复DNA 豇豆遗传多样性 SNP和INDEL Vu03 上 4.2-Mb 染色体倒位的鉴定 与其他暖季 ...

  9. 【豆科基因组】小豆(红豆)adzuki bean, Vigna angularis基因组2015

    目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki be ...

随机推荐

  1. Java:AQS 小记-1(概述)

    Java:AQS 小记-1(概述) 概述 全称是 Abstract Queued Synchronizer(抽象队列同步器),是阻塞式锁和相关的同步器工具的框架,这个类在 java.util.conc ...

  2. Machine learning(1-Introduction)

    1.What is machine learning Field of study that gives computers the ability to learn without being ex ...

  3. 公众号H5页面接入微信登录流程

    公众号H5页面接入微信登录流程 源码地址 https://gitee.com/szxio/h5_weixin 起步 首先创建一个项目,我们采用uni-app来作为我们的前端框架 环境安装 全局安装vu ...

  4. 转载: VIVADO的增量综合流程

    http://xilinx.eetrend.com/content/2019/100044286.html 从 Vivado 2019.1 版本开始,Vivado 综合引擎就已经可以支持增量流程了.这 ...

  5. simulate_click

    #!/bin/bashlet actual_x=104+144*$[$2-1]let actual_y=945+144*$[$1-1]adb shell input tap ${actual_x} $ ...

  6. 正则表达式之grep

    grep 的五个参数,基本的常用的: -a :将 binary 档案以 text 档案的方式搜寻数据 -c :计算找到 '搜寻字符串' 的次数 -i :忽略大小写的不同,所以大小写视为相同 -n :顺 ...

  7. 文件与文件系统的压缩与打包 tar gzip bzip2

    1:linux下常见的压缩文件后缀: .gz .zip .bz2 打包后的: .tar.gz .tar.zip .tar.bz2 2:gzip: 压缩:gzip file 解压:gunzip file ...

  8. C++ 类中 关于常量定义 理解总结

    前言 有时我们希望某些常量只在类中有效.由于#define定义的宏常量是 全局 的,不能达到目的,于是想当然地觉得应该用 const修饰 数据成员来实现.const数据成员的确是存在的,但其含义却不是 ...

  9. for和while的区别及使用

    for for的定义,()内的三段表达式,除了中间的必须产生布尔型,并未对其余两段有所限制,只要是表达式就可以了. //递增和递减 for(int i = 0;i < 100;i++) for ...

  10. 菜鸡的Java笔记 第三十五 接口定义增强

    接口定义增强        在java从一开始到现在接口之中的核心组成部分:抽象方法与全局常量,但是随着技术的不断发展,用户在使用过程之中发现了有一些问题        如果说现在有一个接口经过了长年 ...