目录 一.来源 二.结果 材料测序.变异检测.群体结构和LD衰减 驯化后经历选择的候选基因组区域 起源中心.迁移路线和多样性 GWAS 一.来源 Resequencing of 429 chickpea accessions from 45 countries provides insights into genome diversity, domestication and agronomic traits. Nat Genet. 2019 May;51(5):857-864. doi: 10…
目录 一.来源 二.结果 一.来源 Whole-genome resequencing of 292 pigeonpea accessions identifies genomic regions associated with domestication and agronomic traits. Nat Genet. 2017 Jul;49(7):1082-1088. doi: 10.1038/ng.3872. Epub 2017 May 22. 单位:ICRISAT 二.结果 292 份木…
目录 一.来源 二.结果 683份材料重测序 地方种landraces和育种品系breeding lines的多样性 表型和基因-环境互作(G by E) 菜豆产量潜力相关的MTAs(显著关联位点) 一.来源 Resequencing of 683 common bean genotypes identifies yield component trait associations across a north–south cline. January 2020 Nature Genetics…
转自希望组公众号.学习二代+三代组装策略的流程 垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工.家具等,经济价值极高.近日,芬兰研究人员对垂枝桦自交系个体进行全基因组测序,并对80个来自不同地理范围的桦树个体进行群体重测序,为林木基因组学研究和遗传改良工作提供了研究资源,从而利于生态环境的持续优化. PacBio数据的加入,有效地对基因组初装版本进行了补洞,并在进一步Scaffolding提供高连续性序列,基因组覆盖率达到98.9%(435Mb/…
目录 研究一:G19833组装,2014NG 研究二:BAT 93组装,2016 genome biology 菜豆属(Phaseolus L.)为同源二倍体作物,包含有80 多个物种,多数为野生种,仅有5 个栽培种,分别为普通菜豆(P. vulgaris L.).多花菜豆(P. cocineus L.).利马豆(P. lunatus L.).丛林菜豆(P. dumosus L.)和宽叶菜豆(P. acutifolius L.),其中普通菜豆在世界范围内种植范围最广.栽培面积最大.食用人群最多.…
目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SNP/INDEL 分析和全基因组比对 遗传图谱构建 转座子(TE)检测和重复序列屏蔽 基因预测和注释 转录因子(TF)鉴定 非编码RNA鉴定 转录组组装和豇豆物种形成分析 抗病基因鉴定 全基因组复制分析 来源 Kang, Y., Kim, S., Kim, M. et al. Genome seque…
目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki bean (Vigna angularis) provides insight into high starch and low fat accumulation and domestication 二.研究一(小豆基因组草图) 基因组组装 基因与重复序列预测 小豆驯化痕迹 标记开发及育种应用 红豆基因…
目录 一.前沿概述 二.主要结果 重测序.组装与注释 泛基因组 SV特征 PAV与古多倍化,WGD事件 基因SV与基因融合 SV与大豆驯化 SV影响基因表达及其与性状关联 一.前沿概述 Pan-Genome of Wild and Cultivated Soybeans DOI:10.1016/j.cell.2020.05.023 2020年田志喜老师和梁承志老师强强联合发表大豆泛基因组,这篇文章具有里程碑意义,预示着作物泛基因组时代到来.今年水稻泛基因组同样的策略发在cell. 大豆泛基因组的…
目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechnology) 2015年2月:大豆在驯化和改良过程中遗传多态性明显降低(Nature Biotechnology) 2017年8月:GWAS解析大豆重要性状网络(Genome Biology) 2018年8月:中国国审大豆品种中黄13的基因组完成(Science China Life Science…
全基因组测序 全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序,利用生物信息学分析方法进行拼接.组装,获得该物种的基因组序列图谱,从而推进该物种的后续研究.基因组重测序 是对有参考基因组物种的不同个体进行的基因组测序,并在此基础上对个体或群体进行差异性分析. 基因组重测序主要用于辅助研究者发现单核苷酸多态性位点(SNPs).拷贝数变异(CNV).插入/缺失(I…
生命组学: 细菌和其他物种比,容易发生基因漂移,duplication和重排. 泛基因组学研究的一般思路是通过comparison找到特殊基因区域orspecific gene,研究其调控机制(即通过一维发现特殊三维结构,再利用一维结构解释特殊结构的形成机制eg:基因保守与保守空间结构vs非保守空间结构,同时找两种不同结构的物理位置分布),并向应用上扩展. 重测序与泛基因组的差异在于,重测序是将新测得的genome与referencegenome比较,辨别其中的差异,而泛基因组是将同一个物种中不…
目录 一.来源 二.结果 扁豆的染色体水平高质量组装 扁豆相关农艺性状的QTL定位 直系/旁系同源的演化和物种形成事件 与农艺性状相关基因的直系同源物 群体结构分析揭示扁豆遗传簇 豆荚发育过程中的基因表达 一.来源 Comprehensive genomic resources related to domestication and crop improvement traits in Lima bean. Nature Communications volume 12, Article nu…
目录 来源 结果 基因组大小估计 采用stitching方法组装 修改豇豆染色体编号 基因注释和重复DNA 豇豆遗传多样性 SNP和INDEL Vu03 上 4.2-Mb 染色体倒位的鉴定 与其他暖季豆科植物共线性分析 重复元素和基因组扩张 豇豆基因家族变化 多器官增大候选基因的鉴定 来源 The genome of cowpea (Vigna unguiculata [L.] Walp.). Plant J . 2019 Jun;98(5):767-782. doi: 10.1111/tpj.…
目录 材料与方法 结果分析 本文利用99085个高质量SNP 通过STRUCTURE,PCA和neighbour-joining tree的群体结构分析将地方品种分为三个亚群,这些亚群表现出地理上的遗传分化.利用纬度相差10°的两个位置(北京.武汉)收集的表型数据,鉴定了17个与开花时间性状相关的SNP(TAS),包括一个稳定的基因位点Chr12:5914898和以前未检测到的在开花基因E1和E2附近的候选基因.利用与地方种收集地点相关的已公布数据,鉴定出与三个生物气候学变量(温度,日长和降水)…
目录 一.来源 二.结果 测序组装 组装评价 编码基因预测 基因功能注释 非编码RNA注释 假基因预测 重复序列注释 进化分析和分歧时间估计 全基因组复制 LTR插入时间估计 正选择基因 一.来源 High-quality genome assembly, annotation and evolutionary analysis of the mungbean (Vigna radiata) genome. November 2020. DOI:10.22541/au.160587196.639…
现在BWA大家基本上只用其mem算法了,无论是二代还是三代比对到参考基因组上,BWA应用得最多的就是在重测序方面. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM - arXiv:1303.3997v2 摘要 BWA-MEM is a new alignment algorithm for aligning sequence reads or assembly contigs against a…
全基因组测序 Whole Genome Sequencing 全基因组测序(Whole Genome Sequencing,WGS)是利用高通量测序平台对一种生物的基因组中的全部基因进行测序,测定其 DNA 的碱基序列.利用该技术可在全基因组水平上检测单核苷酸变异 (SNV).插入缺失 (InDel).拷贝数变异 (CNV) 和结构变异 (SV) 等多种全面的突变信息. 研究应用 全基因测序广泛应用于临床医药研究.群体遗传学研究.关联分析.进化分析.变异检测.遗传图谱构建.功能基因挖掘和群体进化…
RNA-seq这个工具该什么时候用?ATAC-seq该什么时候用?有相当一部分项目设计不行,导致花大钱测了一些没有意义的数据. 还是在中心法则这个框架下来解释,这是生物信息的核心.打开华大科技服务官网梳理一下现在到底都有些什么测序技术: 全基因组测序和重测序 - 组装以及寻找变异 (外显子和目标区域测序) RNA-seq测序 - 基因表达 (smRNA,lncRNA,circRNA,PB全长,可变剪切) 甲基化测序 ChIP-seq和ATAC-seq 蛋白组 - 所有蛋白的变化 代谢组 - 植物…
本文学习费章军老师文章Genome of Solanum pimpinellifolium provides insights into structural variants during tomato breeding 如何鉴定SV. 其流程见 https://github.com/GaoLei-bio/SV 1 SV-calling 1.1 基因组间比较 简单思路: 2个基因组比较-->调取unique 比对--〉二代reads比对过滤 软件准备: minimap2 (v2.11 or h…
目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4)质控.基因组组装.质量评估 5)基因组注释 6)生物学分析 7)更多参考内容 5. 动植物Denovo测序项目的主要分析内容 1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法.基于OLC的…
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtmlsamtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件:然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作 是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作):最后将排序或提取得到的数据输出为bam或sam(默认的)…
转自:samtools常用命令详解 samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件:然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作):最后将排序或提取得到…
名词解释 De novo:拉丁文,从头开始的意思,de nove测序则是指在不需要任何参考序列的情况下对某一物种进行基因组测序,然后将测得的序列进行拼接.组装,从而绘制该物种的全基因组序列图谱. 重测序概念:重测序是全基因组重新测序的简称,是指是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析.(没有组装的短的Reads序列) . . Reads:即我们通常说的读长的意思,它是指高通量测序平台直接产生的DNA序列. Contig:是指Reads基于Overl…
一.准备工作     meerkat 0.189版本和以前的版本相比,支持bwa mem 输出的bam文件,还支持全外显子数据count SV. meerkat原理:参见http://compbio.med.harvard.edu/Meerkat/     1.1 需要准备的软件         1. unix/Linux系统(自带) 2. CMake(自带) 3. PERL 5.8.1及以上(自带) 4. BioPERL 1.5.0及以上(自行安装) 5. R 2.3.1及以上(自带) 6.…
[怪毛匠子 整理] samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS map.sam > map.bam"; #第二步:sort 一下 BAM 文件,得到map.sorted.bam system"samtools sort map.b/am map.sorted"; #第三步:创建一个关于bam的索引文件,我们得到一个map.sorted.b…
背景: 1.为什么要从头测序组装基因组? 基因组是不同表型的遗传基础:获得参考基因组是深入研究一个生物体全基因组的第一步也是必须的一步:从头测序组装能够对新的测序物种构建参考基因组: 2.为什么要研究全基因组? 确定基因组中缺失了什么:确定难以生化研究的基因和pathways:研究感兴趣的pathway通路中的每一个基因:研究基因组的非编码区域(introns内含子.promoters启动子.telomeres端粒等)的调控机理和结构特征:基因组提供了一个可以进行各种统计的大型数据库(provi…
HISAT2,StringTie,Ballgown处理转录组数据 本文总阅读量次2017-05-26 HISAT2,StringTie,Ballgown处理转录组数据思路如下: 数据质控 将RNA-seq的测序reads使用hisat2比对 samtools将sam文件转成bam,并且排序,为下游分析做准备 stringtie对每个样本进行转录本组装 stringtie 将所有样本的转录本进行合并 注意:此处的mergelist.txt是自己创建的 计算表达量并且为Ballgown包提供输入文件…
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集,包含有许多命令.以下是常用命令的介绍: view命令的主要功能: 将sam文件转换成bam文件:然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作):最后将排序或提取得到的数据输出为bam或sam(默认的)格式. bam…
转载:http://blog.sina.com.cn/s/blog_6721167201018fyw.html GATK (全称The Genome Analysis Toolkit)是Broad Institute开发的用于二代重测序数据分析的一款软件,里面包含了很多有用的工具. 网址:http://www.broadinstitute.org/gsa/wiki/index.php/Home_Page 前段时间刚发布了2.x版本的,最近几天都在不断更新,网址也搬迁到 http://www.br…
fasta格式 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式.在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释. 格式 序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为起始),用于序列标记.从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号(参见下表).通常核苷酸符号大小写均可,而氨基酸常用大写字母…