全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值(Genomic Estimated Breeding Value, GEBV)估计准确性等加快遗传进展,尤其对低遗传力、难测定的复杂性状具有较好的预测效果,真正实现了基因组技术指导育种实践。

原理

常规育种手段主要利用性状记录值、基于系谱计算的个体间亲缘关系,通过最佳线性无偏估计(best linear unbiased predication,BLUP)来估计各性状个体育种值(EBVs),通过加权获得个体综合选择指数,根据综合选择指数高低进行选留。

标记辅助选择(marker assisted selection, MAS)育种,利用遗传标记,将部分功能验证的候选标记联合BLUP计算育种值,这样不仅可以提高育种值估计的准确性,而且可以在能够获得DNA时进行早期选择,缩短世代间隔,加快遗传进展。

而GS则通过覆盖全基因组范围内的高密度标记进行育种值估计,继而进行排序、选择,简单可以理解为全基因组范围内的标记辅助选择,主要方法是通过全基因组中大量的遗传标记估计出不同染色体片段或单个标记效应值,然后将个体全基因组范围内片段或标记效应值累加,获得基因组估计育种值(GEBV),其理论假设是在分布于全基因组的高密度SNP标记中,至少有一个SNP能够与影响该目标性状的数量遗传位点(quantitative trait loci, QTL)处于连锁不平衡(linkage disequilibrium, LD)状态,这样使得每个QTL的效应都可以通过SNP得到反映

相比BLUP方法,全基因组选择可以有效降低计算个体亲缘关系时孟德尔抽样误差的影响;相比MAS方法,全基因组选择模型中包括了覆盖于全基因组的标记,能更好地解释表型变异。

技术路线

  • 植物GS路线

  • 动物GS路线

GS预期效果:

  1. 缩短育种周期,实现待选群体的低世代选留
  2. 提高育种值估计准确性
  3. 降低育种成本,减少表型鉴定的数量
  4. 预测亲本杂交后代,选择最佳杂交优势组合

统计模型

统计模型是GS的核心,极大地影响了基因组预测的准确度和效率。根据统计模型的不同,全基因组选择的模型大体可分为两大类:

1. 直接法

此方法把个体作为随机效应,参考群体和预测群体遗传信息构建的亲缘关系矩阵作为方差协方差矩阵,通过迭代法估计方差组分,进而求解混合模型获取待预测个体的估计育种值;

2. 间接法

此方法则首先在参考群中估计标记效应,然后结合预测群的基因型信息将标记效应累加,获得预测群的个体估计育种值。

直接法 VS 间接法

性状遗传构建复杂多样,目前还没有一种模型能广泛适用于所有性状。随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率

直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;

间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;

因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。

GS的局限

  • 1)GS主要考虑加性效应,对于显性效应及互作效应等未纳入到育种值估计模型中;

  • 2)GS目前主要在品种内进行,品种间由于遗传背景不同,跨品种预测准确性难以保证;

  • 3)同品种间亲缘关系太远的个体育种值预测效果也不理想,如不同育种公司间由于育种策略不同,选择方向差异,导致同品种间遗传背景也不同,难以实现跨公司预测;

  • 4)GS只用到基因组信息,大量的多组学研究结果利用不够充分,如何将多组学信息进行整合,通过整合组学提高选择准确度也是目前待解决的问题;

  • 5)GS的分型个体数目越来越大,相比传统BLUP的稀疏矩阵,利用基因组信息计算的稠密矩阵给混合模型参数估计及模型求解带来了巨大的挑战,通过数学或着计算机手段简化计算复杂度,才能更高效利用庞大的基因组数据甚至其他各组学数据;

  • 6)个体分型主要是芯片技术,芯片分型具有良好的稳定性,但由于密度不足,使得全基因组选择对LD的依赖性强,通过测序手段可以得到较高密度SNP标记从而减少对LD的依赖,同时测序方法可以捕获不同品种间所有遗传变异,可能实现跨品种预测,并且测序能够得到更丰富的遗传信息,如CNV等,对于亲缘关系较近的群体,可以通过填充技术将芯片个体标记密度填充到测序水平。因此,测序技术的应用将成为全基因组选择新时代的转折点。

GS未来发展

尽管测序技术对GS有利,但高质量的测序结果需要更高的测序深度,意味着测序成本更昂贵,并且测序数据庞大,主流的分析软件处理速度较慢,使用复杂繁琐,对于计算资源的配置需求较高,因此如何快速、有效地储存、处理及分析数据是测序技术应用于全基因组育种的重要挑战,另外,测序只能检测参考基因组中已知的序列和基因信息,对于未知的基因序列和基因还不能进一步深入研究。

随着测序方法和芯片技术的不断成熟,未来个体分型费用将不断降低,分型准确性不断提高,GS将逐步替代传统育种方法。

Ref:http://www.xml-data.org/XMSYXB/html/2019/2/20190201.htm

http://www.lifescience.net.cn/html/201810/20181013.htm

http://blog.sciencenet.cn/blog-2577109-1201959.html

http://www.kangpusen.com/Server/1.html

全基因组选择育种(GS)简介的更多相关文章

  1. 【GS文献】植物全基因组选择育种技术原理与研究进展

    目录 1. 优势杂交育种预测 2. GS育种原理与模型算法 岭回归和LASSO回归 贝叶斯方法 GBLUP和RRBLUP 偏最小二乘法 支持向量机/支持向量回归 其他方法 3. 模型预测能力验证 4. ...

  2. 【GS文献】全基因组选择模型研究进展及展望

    目录 1. GS概况 2. GS模型 1)直接法 GBLUP 直接法的模型改进 ①单随机效应 ②多随机效应 2)间接法 间接法模型 基于间接法的模型改进 3. GS模型比较 模型比较结论 4.问题及展 ...

  3. 【百奥云GS专栏】全基因组选择之工具篇

    目录 1. 免费开源包/库 1.1 R包 1.2 Python库 2. 成熟软件 3. WEB/GUI工具 前面我们已经介绍了基因组选择的各类模型,今天主要来了解一下做GS有哪些可用的软件和工具.基因 ...

  4. 【百奥云GS专栏】全基因组选择之模型篇

    目录 1. 前言 2. BLUP方法 ABLUP GBLUP ssGBLUP RRBLUP 3. 贝叶斯方法 BayesA BayesB BayesC/Cπ/Dπ Bayesian Lasso 4. ...

  5. 【GS模型】全基因组选择之rrBLUP

    目录 1. 理论 2. 实操 2.1 rrBLUP包简介 2.2 实操 3. 补充说明 关于模型 关于交叉验证 参考资料 1. 理论 rrBLUP是基因组选择最常用的模型之一,也是间接法模型的代表.回 ...

  6. 【百奥云GS专栏】1-全基因组选择介绍

    目录 什么是基因组选择? 基因组选择技术的发展 基因组选择的原理和流程 基因组选择的模型 基因组选择的展望 参考资料 什么是基因组选择? 基因组选择(Genomic Selection,简称GS)这一 ...

  7. 【GS文献】基因组选择在植物分子育种应用的最新综述(2020)

    目录 1. 简介 2. BLUP类模型 3. Bayesian类模型 4. 机器学习 5. GWAS辅助的GS 6. 杂交育种 7. 多性状 8. 长期选择 9. 预测准确性评估 10. GS到植物育 ...

  8. 【GS文献】植物育种中基因组选择的方法、模型及展望

    目录 1. GS/GP在植物育种中的角色 2. GP模型应用 3. GP模型的准确性 4. 植物育种的GS展望 5. 小结 Genomic SelectioninPlant Breeding: Met ...

  9. 【GS文献】基因组选择技术在农业动物育种中的应用

    中国农业大学等多家单位2017年合作发表在<遗传>杂志上的综述,笔记之. 作者中还有李宁院士,不胜唏嘘. 1.概述 GS的两大难题:基因组分型的成本,基因组育种值(genomic esti ...

随机推荐

  1. IDEA 激活码,最新激活码,亲测有效,持续更新(2021.10.26)

    这里整理了一份 IntelliJ IDEA的最新激活码,持续更新 获取链接:[腾讯文档]分享白嫖JB Account和激活码(并附带破解工具) https://docs.qq.com/doc/DVnB ...

  2. VS2015+OpenCV+Qt

    VS2015+OpenCV+Qt 01.OpenCV 下载 进入官网链接: https://opencv.org,下载所需要的版本: 下载完成后直接双击,选择解压路径,解压到响应的文件夹中: 若之后需 ...

  3. UltraSoft - Alpha - Scrum Meeting 1

    Date: Apr 06th, 2020. 会议内容为讨论功能规格书和技术规格书的撰写. Scrum 情况汇报 进度情况 组员 负责 昨日进度 后两日任务 CookieLau PM.后端 进行Djan ...

  4. ruby基本图片上传

    图片上传问题 在我们的项目里,需要实现海报的图片上传,便于更好地向外界展示一个社团活动的基本内容,但是在处理中间件相关问题时遇到了一点小小的挫折.不过这并不要紧,OSS对象存储服务固然好,但是本着交完 ...

  5. 微信小程序实现上拉和下拉加载更多

    在上一篇文章中,我们知道了使用 scroll-view 可以实现上拉加载更多,但是由于 scroll-view 的限制,它无法实现下拉加载更多,这篇文章我们使用 view 组件来实现 上拉和下拉加载更 ...

  6. RocketMQ源码详解 | Producer篇 · 其二:消息组成、发送链路

    概述 在上一节 RocketMQ源码详解 | Producer篇 · 其一:Start,然后 Send 一条消息 中,我们了解了 Producer 在发送消息的流程.这次我们再来具体下看消息的构成与其 ...

  7. Linux入门必须养成的七大习惯

    对于很多Linux初学者来说,在刚开始使用linux系统时会感到很多的不适.这里为大家整理了自己以前linux入门时别人告诉我的七个习惯.我相信如果你运用了这七个习惯,在你使用Linux时你会感觉更安 ...

  8. 单片机STM32的5个时钟源知识

    众所周知STM32有5个时钟源HSI.HSE.LSI.LSE.PLL,其实他只有四个,因为从上图中可以看到PLL都是由HSI或HSE提供的. 其中,高速时钟(HSE和HSI)提供给芯片主体的主时钟.低 ...

  9. 另类加法 牛客网 程序员面试经典 C++ Python

    另类加法  牛客网 程序员面试经典 C++ Python 题目描述 请编写一个函数,将两个数字相加.不得使用+或其他算数运算符. 给定两个int A和B.请返回A+B的值 测试样例: 1,2 返回:3 ...

  10. NOIP模拟88(多校21)

    前言 对于这套题的总体感觉就是难,然后就是自己很菜... 对于 T1 考试时只会一个最垃圾的背包,考完之后对于思路这一块也不是很顺利,大概这就是薄弱的地方吧. 然后 T2 是比较简单的一道题了,但是考 ...