【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell
一、前沿概述
Pan-Genome of Wild and Cultivated Soybeans
DOI:10.1016/j.cell.2020.05.023

2020年田志喜老师和梁承志老师强强联合发表大豆泛基因组,这篇文章具有里程碑意义,预示着作物泛基因组时代到来。今年水稻泛基因组同样的策略发在cell。
大豆泛基因组的研究:
- 大豆基因组:2010年,Schmutz等发表了栽培大豆第一个reference genome Williams 82(Wm82)。2018年,田志喜老师等对我国栽培面积最广的大豆品种“中黄13”(Zhonghuang 13,ZH13)进行从头组装测序,并于2019年对ZH13基因组再次优化。2019年,Xie等发表了野生大豆W05基因组。对这三个基因组进行比较分析发现,在不同品种的基因组间存在大量的PAVs和CNVs。
- 2014年,邱丽娟老师等利用二代测序构建了7个野生大豆的泛基因组。
- 2020年,26份大豆泛基因组发表(本研究)。
- 2021年,加拿大拉瓦尔大学在Plant Biotechnology Journal上发表了题为The Pan-genome of the Cultivated Soybean (PanSoy) Reveals an Extraordinarily Conserved Gene Content 的研究成果,描述了一个栽培大豆(Glycine max)的泛基因组—PanSoy;发现了核心基因组中高度保守的基因含量,为大豆基因组学研究和育种奠定了基础。
本研究示意图:

本研究主要结果:
- 对来自世界大豆主产国的2898个大豆种质材料进行了深度重测序和群体结构分析,精心挑选出26个最具代表性的大豆种质材料,包括3个野生大豆,9个农家种和14个现代栽培品种。
- 采用最新组装策略,对26个大豆种质材料进行了高质量的基因组从头组装和精确注释,contig N50平均长度达22.6 Mb, scaffold N50 平均长度达 51.2 Mb。
- 在此基础上,结合已经发表的中黄13、Williams 82 和 W05 基因组,开展了系统的基因组比较,构建了高质量的基于图形结构泛基因组,挖掘到大量利用传统基因组不能鉴定到的大片段结构变异。
- 经深入分析发现,结构变异在重要农艺性状调控中发挥重要作用:例如,HPS基因的结构变异调控大豆种皮亮度变化;野生与栽培大豆CHS基因簇的结构变异是导致种皮颜色由黑色向黄色驯化的主要原因;SoyZH13_14G179600基因结构变异导致了其在不同种质材料中基因表达的差异,可能与调控大豆缺铁失绿症有关。
- 此外,研究还鉴定到15个结构变异导致了不同基因间的融合,这为新基因的产生研究提供了重要线索。
此高质量图形结构泛基因组的构建不仅本身具有重要的理论意义和应用价值,同时为过去已经开展的大量重测序数据提供了一个全新的分析平台,将使得这些数据获得“第二次生命”。
黄三文老师对此研究的评述文章:
360度群体遗传变异扫描——大豆泛基因组研究
二、主要结果
重测序、组装与注释
2898份大豆重测序,SNP检测,群体分析

26份材料PacBio+光学图谱+HiC+Illumina从头组装。平均Contig N50: 22.6Mb,Genome: 1011.6Mb。
注释重复序列占到54.4%,其中LTR比例最大。每个基因组平均鉴定到56,552个蛋白编码基因,BUSCO:95.6% 。

29份和2898份材料变异图谱

denovo与重测序的相关性
Correlation of SNP density, p, dN, and dS from 29 de novo assembled genomes and 2,898 resequenced accessions

泛基因组
核心与非核心基因

注释与多样性

SV特征


具体特征统计

功能

PAV的GWAS:种子光泽示例

PAV与古多倍化,WGD事件
WGD与非WGD区域的基因和SV特征比较。



基因SV与基因融合


SV与大豆驯化
大豆中I Locus的演化。
The classically defined I locus is an important domestication locus responsible for the changes in seed coat color from black to colorless
CHS基因:reduced chalcone synthase(CHS) gene


野生大豆和栽培大豆在7号染色体的一个倒位可能与驯化相关。

SV影响基因表达及其与性状关联
不同材料中铁效率QTL候选基因的SV

文章的信息量很大,这里只是囫囵吞枣放了几张图。开创性的研究才是佳作,我辈只能模仿。
【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell的更多相关文章
- 【豆科基因组】大豆(Soybean, Glycine max)经典文章梳理2010-2020
目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechn ...
- 【豆科基因组】绿豆Mungbean, Vigna radiata基因组2014NC
目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SN ...
- 基因家族收缩和扩张分析 & Selective loss pathway & 泛基因组
套路 这通常就是基因组组装后的必做分析,通过比较基因组学的手段进行分析,可以知道所研究物种在进化过程中哪些核心基因家族发生了变化,从而导致了其特殊的适应性机制的形成. 参考: Extremotoler ...
- 植物基因组|注释版本问题|重测序vs泛基因组
生命组学: 细菌和其他物种比,容易发生基因漂移,duplication和重排. 泛基因组学研究的一般思路是通过comparison找到特殊基因区域orspecific gene,研究其调控机制(即通过 ...
- 常用数据库ID格式
转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID ID 示例 ID 来源 ENSG00000116717 Ensemble ID GA ...
- 常用生物信息 ID 及转换方法
众多不同的数据库所采用的对 Gene 和 Protein 编号的 ID 也是不同的, 所以在使用不同数据库数据的时候需要进行 ID 转换. 常用数据库 ID ID 示例 ID 来源 ENSG00000 ...
- 【豆科基因组】大豆适应性位点GWAS分析 [转载]
目录 材料与方法 结果分析 本文利用99085个高质量SNP 通过STRUCTURE,PCA和neighbour-joining tree的群体结构分析将地方品种分为三个亚群,这些亚群表现出地理上的遗 ...
- 【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC
目录 一.来源 二.结果 扁豆的染色体水平高质量组装 扁豆相关农艺性状的QTL定位 直系/旁系同源的演化和物种形成事件 与农艺性状相关基因的直系同源物 群体结构分析揭示扁豆遗传簇 豆荚发育过程中的基因 ...
- 【豆科基因组】小豆(红豆)adzuki bean, Vigna angularis基因组2015
目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki be ...
随机推荐
- Scrum Meeting 0522
零.说明 日期:2021-5-22 任务:简要汇报两日内已完成任务,计划后两日完成任务 备注:由于在Beta冲刺阶段的最后一周中团队成员需要准备必修课程计算机网络的相关考试,所以为了保证Beta功能的 ...
- 2020BUAA软工个人项目作业
2020BUAA软工个人项目作业 17373010 杜博玮 项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) 这个作业的要求在哪里 个人项目作业 我在这个课程的目标是 学 ...
- CSP/S 2020 退役记
上一次的AFO记 上上次的AFO记 Day -INF 一条咸鱼的垂死挣扎. RP+=INF Day 0 出发辣. 早上来到机房,带上了准备的面包和泡面....然而后来嫌太占地方就没拿...草了. 而且 ...
- USART 硬件流控
流控的概念源于 RS232 这个标准,在 RS232 标准里面包含了串口.流控的定义.大家一定了解,RS232 中的"RS"是Recommend Standard 的缩写,即&qu ...
- SpringCloud 2020.0.4 系列之Hystrix看板
1. 概述 老话说的好:沉默是金,有时适当的沉默,比滔滔不绝更加有效. 言归正传,前面我们聊了有关 Hystrix 降级熔断的话题,今天我们来聊聊如何使用 turbine 和 hystrix dash ...
- cf2A Winner(implementation)
题意: N个回合. 每个回合:name score[名为name的这个人得了score分(可负可正)]. 问最后谁的累积分数是最高的.设为M.如果有好几个都得了M,找出这几个人中哪个最早回合累积分数超 ...
- Java之父 James Gosling 发表博文 《Too Soon》纪念乔布斯。
几个礼拜前,我们还在讨论乔布斯的辞职.虽然我们都知道这意味着什么,但是我没有想到一切来的如此之快.已经有很多关于这件事情的文章了,特别是"经济学人"的这篇文章. 乔布斯是一个很独特 ...
- makefile编译子目录
make子目录常用方法 一般是 SUB_DIR = lib_src service .PHONY: subdirs $(SUB_DIR) subdirs: $(SUB_DIR) $(SUB_DIR): ...
- 使用Charles 弱网测试
打开Charles->Proxy→Throttle Settings 1.可以选择不通的网络类型,对于网络的配置一般修改下上行下行即可 2.网络设置各字段解释 bandwidth -- 带宽,即 ...
- mysql根据条件决定是否插入数据
这个问题其实分两个方面: 1.根据表的主键决定数据是否插入. 2.根据表的非主键决定是否插入. 假设有表DOC_INFO(医生表),联合主键HOS_ID(医院代码),DEPT_CODE(科室代码),D ...