目录 1. 简介 2. BLUP类模型 3. Bayesian类模型 4. 机器学习 5. GWAS辅助的GS 6. 杂交育种 7. 多性状 8. 长期选择 9. 预测准确性评估 10. GS到植物育种 11. 未来展望 2020年10月张志武老师联合多家单位的大佬撰写的植物GS育种的最新进展,目前还只是预印版(改到第二版).这篇综述涉及到GS在植物领域应用的最新进展,长达48页.不同于其他的综述描写空洞宽泛,这一篇特别对模型方法进行了介绍,正好解决了我的需求.缺点就是可能重点说明了他们自己开发…
综述:Genomic Selection in the Era of Next Generation Sequencing for Complex Traits in Plant Breeding 要点: MAS仅对数量较少的主效QTL有效,而GS适用于大量微效QTL控制的复杂数量性状.GS根据分布在整个基因组中的大量标记信息来估计个体的遗传价值,而不是像MAS中那样基于少量标记. GS由Meuwissen(2001)等人提出,一开始应用于动物,最近才应用作物育种.主要是因为NGS的成本下降(尤…
目录 1. GS/GP在植物育种中的角色 2. GP模型应用 3. GP模型的准确性 4. 植物育种的GS展望 5. 小结 Genomic SelectioninPlant Breeding: Methods,Models,and Perspectives 国际玉米小麦改良中心(CIMMYT)José Crossa 2017年发表在<Trends in Plant Science>上的综述. 1. GS/GP在植物育种中的角色 过去的植物育种主要借助分子标记辅助选择法(MAS)来进行表型选择(…
目录 1. 优势杂交育种预测 2. GS育种原理与模型算法 岭回归和LASSO回归 贝叶斯方法 GBLUP和RRBLUP 偏最小二乘法 支持向量机/支持向量回归 其他方法 3. 模型预测能力验证 4. 局限性 基于数学建模的杂交种预测的一些假设: 影响因素 5. 展望 1. 优势杂交育种预测 杂交育种:选育优良纯合亲本,再进行亲本配组. 杂种优势与亲本间的遗传差异有关,前人通过遗传标记计算亲本间的遗传距离.但遗传距离和杂种优势的相关性只能在一定程度上定性地评价杂交组合的表现,并不能定量地预测表现…
目录 说明 1.前言 2.植物GS瓶颈 3.提高GS预测的准确性 4.GS与现代育种技术结合 5.GS开源育种网络 说明 Enhancing Genetic Gain through Genomic Selection: From Livestock to Plants 这篇是徐云碧老师2019年发表在<Plant Communications>上的综述.徐老师是农科院作科所以及CIMMYT的分子育种专家,著有<分子数量遗传学>和<分子植物育种>,提出环境型.遗传增益等…
中国农业大学等多家单位2017年合作发表在<遗传>杂志上的综述,笔记之. 作者中还有李宁院士,不胜唏嘘. 1.概述 GS的两大难题:基因组分型的成本,基因组育种值(genomic estimted breeding value, GEBV)的准确性. 基于个体的基因组估计育种值GEBV比传统基于系谱的估计育种值(estimted breeding value, EBV)准确性更高. GS实施示意图: 基于单点SNP标记的GEBV估计方法 一类基于估计等位基因效应来计算GEBV: ①最小二乘法…
目录 1. GS概况 2. GS模型 1)直接法 GBLUP 直接法的模型改进 ①单随机效应 ②多随机效应 2)间接法 间接法模型 基于间接法的模型改进 3. GS模型比较 模型比较结论 4.问题及展望 文献来源: 尹立林, 马云龙, 项韬, 朱猛进, 余梅, 李新云, 刘小磊, 赵书红. 全基因组选择模型研究进展及展望[J]. 畜牧兽医学报, 2019, 50(2): 233-242. 华中农大赵书红老师于2019年发表在< 畜牧兽医学报>上的综述,主要针对动物. 1. GS概况 2009年…
目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuwissen(挪威生命科学大学) GS概念提出者,号称"基因组选择之父",贝叶斯方法为主,但是做动物的,所以可略过. https://www.researchgate.net/scientific-contributions/Theo-H-E-Meuwissen-2120554457 Ign…
全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值(Genomic Estimated Breeding Value, GEBV)估计准确性等加快遗传进展,尤其对低遗传力.难测定的复杂性状具有较好的预测效果,真正实现了基因组技术指导育种实践. 原理 常规育种手段主要利用性状记录值.基于系谱计算的个体间亲缘关系,通过最佳线性无偏估计(best linear unbiased predication…
目录 1. 前言 2. BLUP方法 ABLUP GBLUP ssGBLUP RRBLUP 3. 贝叶斯方法 BayesA BayesB BayesC/Cπ/Dπ Bayesian Lasso 4. 机器学习 支持向量机 集成学习 深度学习 5. 其他模型 RKHS GWAS-assisted GS 非加性效应 多变量模型 多组学 6. 小结 参考资料 1. 前言 在介绍GS模型之前,我们有必要先来了解一下混合线性模型(Mixed Linear Model,MLM).混合线性模型是一种方差分量模…
目录 什么是基因组选择? 基因组选择技术的发展 基因组选择的原理和流程 基因组选择的模型 基因组选择的展望 参考资料 什么是基因组选择? 基因组选择(Genomic Selection,简称GS)这一概念由挪威生命科学大学的Theo Meuwissen 教授于2001年提出.它是一种利用覆盖全基因组的高密度分子标记进行选择育种的新方法,可通过构建预测模型,根据基因组估计育种值(Genomic Estimated Breeding Value, GEBV)进行早期个体的预测和选择,从而缩短世代间隔…
目录 1. 免费开源包/库 1.1 R包 1.2 Python库 2. 成熟软件 3. WEB/GUI工具 前面我们已经介绍了基因组选择的各类模型,今天主要来了解一下做GS有哪些可用的软件和工具.基因组选择处在热门研究阶段,每年都有不少新工具开发出来,可分析的软件非常之多,为了便于大家更加清晰地了解,这里我将它们分为免费开源包/库.成熟软件.WEB/GUI工具三类,用户使用难度依次降低. 1. 免费开源包/库 R和Python语言作为开源软件的代表,在数据分析领域有着不可替代的优势.近几年大部分…
目录 1. 理论 2. 实操 2.1 rrBLUP包简介 2.2 实操 3. 补充说明 关于模型 关于交叉验证 参考资料 1. 理论 rrBLUP是基因组选择最常用的模型之一,也是间接法模型的代表.回顾一下,所谓间接法是指:在参考群中估计标记效应,再结合预测群的基因型信息将标记效应累加,最终获得预测群的个体估计育种值.而直接法则是指:将个体作为随机效应,参考群体和预测群体遗传信息构建的亲缘关系矩阵作为方差协方差矩阵,通过迭代法估计方差组分,进而求解混合模型获取待预测个体的估计育种值.简言之,直接…
目录 GS两步走 示例 缩短周期和成本 分类 杂交类型 试验研究 选择响应 选择的强度 选择的周期 预测能力 数据分析的注意事项 GS实施 优缺点 GS的成功 展望 GS两步走 示例 缩短周期和成本 分类 杂交类型 试验研究 选择响应 选择的强度 选择的周期 预测能力 数据分析的注意事项 GS实施 优缺点 GS的成功 展望 本课件来自Jose Osorio的报告(2013IIIinois Corn Breeders' School)…
目录 简介 GS示例代码 简介 R包sommer内置了C++,运算速度还是比较快的,功能也很丰富,可求解各种复杂模型.语法相比于lme4包也要好懂一些. 建议查看文档:vignette("v1.sommer.quick.start") 混合线性模型关键在于协方差结构的建立,有以下几类: 复合对称(Compound Symmetry,CS),所有方差相等,所有协方差也相等,对应于单变量方法.但是对于不同尺度的变量是无意义的. 方差组分(Variance Components),每个方差都…
目录 1.GWAS模型 1.1卡方检验 1.2 相关性系数的t检验 1.3 一般线性模型GLM 1.4 混合线性模型MLM 1.5 压缩混合线性模型CMLM 1.6 SUPER 1.7 FarmCPU 1.8 Blink 2.GS模型 2.1 MAS 2.2 GBLUP 2.3 GBLUP的扩展(ssBLUP,sBLUP,cBLUP) 2.4 rrBLUP 2.5 rrBLUP的扩展(Bayes类) 2.6 BLUP vs Bayes 3.GWAS和GS模型比较 最近看了不少统计基因组方面的资料…
文献名:Integrative Analysis of MicroRNAome, Transcriptome, and Proteome during the Limb Regeneration of Cynops orientalis(东方蝾螈肢体再生的小RNA组,转录组,蛋白质组综合分析) 期刊名:Journal of Proteome Research 发表时间:(2019年1月4日) IF:3.950 单位: 西北大学生命科学学院组织工程实验室 陕西生物技术省级重点实验室 教育部西部资源…
copy from  : https://zhuanlan.zhihu.com/p/30605683 一.查文献 首先,我认为需要常备几个体量大.文献全的数据库,有针对性找哦!下面列出了一些适合所有专业常用的文献查阅地址: 1.Semantic scholar 微软联合创始人Paul Allen投资开发的新一代学术搜索引擎,几乎80%的文章都可以在上面下载.它可以自动计算这个文章的重要性.贡献,并且,对于一个文章来说,可以智能查找引用(如文章A引用了50篇引文,那么直接在网页上可以看到文章都是怎…
OA|开放获取期刊|掠夺性期刊|DOI|ORCID|图书馆服务|零次文献| 信息检索 信息素质是什么? 信息素质是指一个人的信息需求.信息意识.信息知识.信息道德.信息能力方面的基本素质. Some questions: OA是什么? OA:open access获取不用花费 在信息化时代,随着数据.学者和评价指标变多,如何找到该研究领域下最新进展文章? 可以利用本组文章引用去向得到该科学领域最新研究进展 学习的四个方面: 意识---能力---道德----终身学习 意识: 科研信息的种类很多,研…
“国家重点实验室”完全名单 单位名称(序号)   国家重点实验室名称  建设单位 中国科学院(73) 1   半导体超晶格国家重点实验室  中国科学院半导体研究所 2   应用光学国家重点实验室  中国科学院长春光学精密机械与物理研究所 3   稀土资源利用国家重点实验室  中国科学院长春应用化学研究所 4   电分析化学国家重点实验室    中国科学院长春应用化学研究所 5   催化基础国家重点实验室  中国科学院大连化学物理研究所 6   大气边界层物理和大气化学国家重点实验室  中国科学院…
解析Illumina+PacBio组装策略 (2016-12-08 13:21:58) 转载▼     基于Illumina和PacBio平台的“二加三”组装策略,巧妙的融合了PacBio平台超长读长.无PCR扩增和Illumina平台成本低等优势,成为目前基因组研究最经济有效的方式.那么问题来了,这个“二加三”策略究竟是如何利用两种平台测序数据的?是以二代数据为主还是以三代数据为主?今天,小编将为您揭晓答案. 方案一:以三代数据为主,通过三代数据进行组装,使用二代数据对三代数据进行纠错. 这是…
在注释KEGG的时候,一直用到kaas,具体kaas是个什么东东,简单的总结一下吧.     KEGG是由日本人搞的一个代谢图,收录基因和基因组的数据库,数据库可以分为 3大部分,基因数据库, 化学分子物质数据库,以及基于基因和化学分子物质相互关系而建立起来的代谢路径数据库,在KEGG数据库中,有一个"专有名词"KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K标签,KEGG ortho…
NGS又称为下一代测序技术,高通量测序技术 以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可大大降低测序费用.缩短测序时间的测序技术. Sanger法测序(一代测序):是一种利用DNA聚合酶来延伸结合在待定序列模板上的引物的测序技术.每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP).由于ddNTP缺乏延伸所需要的3-OH基团,使延长的…
目录 前言 四个SNP集 hapmapSNPs tagSNPs fixedSNPs barcodeSNPs hapmapSNPs的指标统计 tagSNPs的群体结构验证 tagSNPs的遗传多样性 tagSNPs用于GS fixedSNPs验证 barcodeSNPs指纹图谱 barcodeIndel SR4R数据库 前言 王向峰老师2020年发表在<Genomics Proteomics Bioinformatics>(IF=6.597)上的文章.对于做数据分析的人来说,如何挖掘公共数据,如…
[转载]如何通过RNA-Seq了解转录本的结构 已有 1942 次阅读 2014-12-26 15:22 |个人分类:转录组测序|系统分类:科研笔记|关键词:RNA-Seq,转录组测序,转录本结构| RNA-seq, 转录组测序, 转录本结构 |文章来源:转载 测序转录组的方法可不止一种.一些研究人员的目标是计数转录本,评估表达水平,则测序可代替DNA芯片.而另一些研究人员感兴趣的是转录本的结构.大家都知道,真核生物的基因常常经过选择性剪接.是否包含特定的外显子,这有着深远的生物学影响. 前一个…
使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi Tian1, Gordon K. Smyth4 and Matthew E. Ritchie5 1The Walter and Eliza Hall Institute of Medical Research, 1G Royal Parade, Parkville, VIC 3052, Melbo…
冷冻电镜 为什么冷冻电镜 (Cryo-EM) 技术的发明可以获得2017诺贝尔化学奖?知乎看法 Press release: The Nobel Prize in Chemistry 2017 We may soon have detailed images of life’s complex machineries in atomic resolution. 不久的将来,我们所有的生命复合体机器都能得到精确的原子层次的分辨结构. Electron microscopes were long b…
Carlo Batini, Cinzia Cappiello, Chiara Francalanci, and Andrea Maurino. 2009. Methodologies for data quality assessment and improvement. ACM Comput. Surv. 41, 3, Article 16 (July 2009), 52 pages. (gs:173) 这篇论文是关于数据质量方法的综述,全文共52页(其中正文34页,附录18页),对现有的"d…
http://blog.csdn.net/zouxy09/article/category/1218765 图像卷积与滤波的一些知识点 图像卷积与滤波的一些知识点zouxy09@qq.comhttp://blog.csdn.net/zouxy09       之前在学习CNN的时候,有对卷积经常一些学习和整理,后来就烂尾了,现在稍微整理下,先放上来,以提醒和交流.一.线性滤波与卷积的基本概念      线性滤波可以说是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果.做法很…
基于 NetFPGA 的 VCP 网络的设计与实现 --可变结构拥塞控制协议(VCP),适应于高带宽时延乘积网络的显式拥塞控制协议 无源光网络(PON) 1.区块链技术发展,物联网设备激增,服务器压力增大,为缓解服务器压力,提出10G FPGA NIC缓存技术,可以减少服务器工作负载.我们实现了在NETFPGA-10G板上实现高吞吐量的硬件缓存. --An FPGA NIC Based Hardware Caching for Blockchain 2017 2.之前配置网络专注于集中式配置,并…