Pacbio 纯三代组装复活草基因组
对于植物等真核生物基因组来说,重复序列, 多倍体,高杂合度等特征在利用二代数据进行组装的时候都会有很大的问题;
利用二代数据组装出来的基因组,大多达不到完成图的水准,通常只是覆盖到编码蛋白的基因区域,还是会有很多的区域覆盖不到,而这些区域正是发挥调控功能的非编码基因区域,近年来,非编码功能的研究越来越多,如果拼接出来的基因组上缺少这部分序列,无法进行后续的研究;
而且由于测序读长的限制和拼接算法的原因,对于重复序列,GC异常区域,会存在组装错误,甚至组装不出来;
三代测序,其长读长和无GC偏好性等特点,降级了基因组组装时的难度,可以组装出在二代数据中很难组装出来的重复序列和GC异常序列,非常适合做基因组的组装;
研究人员利用PacbBio RSII 测序平台对复活草进行测序,使用了32个SMRT cells, 测序深度72X
最终组装出来的结果包含650条contigs, 覆盖度为99%(估计的基因组大小为245Mb, contig的总长度为244Mb),conig的N50长度为2.4M,
同时还组装出来完整的叶绿体基因组,大小为125,324 bp, 其中有大约25kb为重复序列,
分析使用的是HGAP的组装流程,参数如下:
The Oropetium genome was assembled using the
RS_HGAP_Assembly.3 protocol for assembly and Quiver for genome polishing in SMRT Analysis v2.3.012. This consisted of a three-step process involving
(1) generation of preassembled reads with improved consensus accuracy;
(2) assembly of the genome through overlap consensus accuracy using Celera; and
(3) one round of genome polishing with Quiver.
For HGAP, the following parameters were used:
PreAssembler Filter v1 (
minimum sub-read length= 3,000 bp,
minimum polymerase read quality = 0.80,
minimum polymerase read length= 3,000bp
);
PreAssembler v2 (
minimum seed length= 16,000 bp,
numberof seed read chunks= 6,
alignment candidates per chunk= 10,
total alignment candidates= 24,
min coverage for correction= 6
);
AssembleUnitig v1 (
target genome coverage= 30,
overlap error rate= 0.06,
minimum overlap= 40 bp,
overlap k-mer= 14
);
BLASR v1 mapping of reads for genome polishing with Quiver (
max divergence percentage= 30,
minimum anchor size= 12).
A second round of genome polishing was performed using Quiver (SMRT Analysis v2.3.0) to
further improve the site-specific consensus accuracy of the assembly.
The following Quiver parameters were used for genome polishing:
filtering (
minimum sub-read length= 3,000 bp,
minimum polymerase read quality= 0.80,
minimum polymerase read length= 3,000 bp);
mapping (
maximum divergence percentage= 30,
minimum anchor size= 12).
Default parameters were otherwise employed for both HGAP assembly and Quiver protocols
Pacbio 纯三代组装复活草基因组的更多相关文章
- 安装三代组装canu、smartdenovo、wtdbg及矫正软件Racon、Nanopolish的安装
1)三代组装软件 ------------------------------------------------------------------canu--------------------- ...
- 纯脚本组装Json格式字符串
var answerStr = "["; for (var i in answer) { var data = $("input[name=QuestionItem_&q ...
- 人类基因组三代组装: cano
git clone https://github.com/marbl/canu.git cd canu/src make -j <number of threads> 使用实例: canu ...
- 10X Genomics vs. PacBio
10X Genomics已经广泛应用于单细胞测序.组装领域,现在也是火的不行. 10X Genomics原理 通过将来自相同DNA片段(10-100kb)的reads加上相同的barcode,然后在i ...
- 解析Illumina+PacBio组装策略
解析Illumina+PacBio组装策略 (2016-12-08 13:21:58) 转载▼ 基于Illumina和PacBio平台的“二加三”组装策略,巧妙的融合了PacBio平台超长读长 ...
- 基因组所三代单分子测序PacBio完成技术升级—超长读长助力基因组学研究
基因组所三代单分子测序PacBio完成技术升级—超长读长助力基因组学研究 2015-09-23 | 作者:所级中心基因组平台 张兵 [关闭] 近日,基因组所所级中心基因组平台三代单分子实时测序PacB ...
- 三代PacBio reads纠错 - 专题
三代纠错的重要性不言而喻,三代的核心优势就是长,唯一的缺点就是错误率高,但好就好在错误是随机分布的,可以通过算法解决,这也就是为什么现在有这么多针对三代开发的纠错工具. 纠错和组装是分不开的,纠错就是 ...
- 基因组Denovo组装原理、软件、策略及实施
目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...
- 【转】NG:垂枝桦基因组图谱构建(2+3组装)及重测序分析
转自希望组公众号.学习二代+三代组装策略的流程 垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工.家具等,经济价值极高.近日,芬兰研究人员对垂枝桦自交系 ...
随机推荐
- 【Android】19.2 ShareActionProvider类—帮你把信息分享出去
分类:C#.Android.VS2015: 创建日期:2016-03-06 一.简介 共享操作提供程序类(ShareActionProvider)简化了你希望与其他人(或者其他应用程序)共享或分享出来 ...
- 内网IP和外网IP
1.什么是内网内网就是局域网,比如一个公司的局域网,局域网内每台计算机的IP地址是互异的,但不同局域网内的IP是可以相同的.2.什么是外网外网就是互联网,内网的所有计算机都是连接到一个外网IP,通过外 ...
- 用C++画光(二)——矩形
在上篇文章的基础上,做了许多调整,修复了许多BUG.在解决bug的过程中,我逐渐领悟到一个要领:枯燥地一步步调试太痛苦了,找不到问题的根源!所以我选择将中间结果打到图片上.如: (注意,里面的点是我随 ...
- struts2文件下载的编写步骤(文件导出)和输入流转换的方法
strut2文件下载三部曲:一个流.两个头信息 说明: ①一个流,在Action中需要一个getInputStream()的方法来获取下载的内容,其中inputStream是默认的,他会指示Strea ...
- LeetCode: Longest Consecutive Sequence 解题报告
Longest Consecutive Sequence Given an unsorted array of integers, find the length of the longest con ...
- c++之五谷杂粮4---explicit
4.1在要求隐式转换的程序上下文中,我们可以通过将构造函数声明为explicit加以阻止. 关键字explicit只对一个实参的构造函数有效.需要多个实参的构造函数不能用于执行隐式转换,所以无需将这些 ...
- druid使用
https://blog.csdn.net/weinichendian/article/details/78503469
- c# 操作Word总结【转】
http://www.cnblogs.com/eye-like/p/4121219.html 在医疗管理系统中为保存患者的体检和治疗记录,方便以后的医生或其他人查看.当把数据保存到数据库中,需要新建很 ...
- 【C#/WPF】TextBlock/TextBox/Label编辑文字的问题
标题有点描述不清,就当是为了方便自己用时易于搜索到. 总之需求是:显示用户信息(文字)时,允许用户编辑自己的信息. 效果图如下: 点击[编辑]按钮前: 点击[编辑]按钮后,允许编辑: 别吐槽为甚性别还 ...
- 构建基于分布式SOA架构的统一身份认证体系
摘要:本文充分利用SOA架构松耦合的特点,通过规范统一网络接口实现业务系统整合,既提升系统安全性,又简化资源访问操作,具有重要的理论和现实意义. 统一身份认证旨在将分散在各个信息系统中的用户和权限资源 ...