NECAT组装ONT long reads

NECAT 可用于ONT数据的纠错，组装，如果想对ONT long reads进行call SV，也可以使用necatsv.

githup网址：https://github.com/xiaochuanle/NECAT/blob/master/README.md

安装

两种方法：

第一种方法

 wget https://github.com/xiaochuanle/NECAT/releases/download/v0.0.1_update20200803/necat_20200803_Linux-amd64.tar.gz

 tar xzvf necat_20200803_Linux-amd64.tar.gz

 cd NECAT/Linux-amd64/bin

 export PATH=$PATH:$(pwd)

第二种方法

 git clone https://github.com/xiaochuanle/NECAT.git

 cd NECAT/src/

 make

 cd ../Linux-amd64/bin

 export PATH=$PATH:$(pwd)

最后加入环境变量即可

简单使用

Step 1 配置文件

necat.pl config config.txt

会得到一个config.txt的配置文件，并对其进行配置，比如

PROJECT=17s1XX

ONT_READ_LIST=read_list.txt

GENOME_SIZE=1000000000

THREADS=4

MIN_READ_LENGTH=3000

起他可以默认即可

read_list.txt 为long reads的绝对路径

Step 2 correct raw reads

necat.pl correct ecoli_config.txt

只对40X（PREP_OUTPUT_COVERAGE）的reads进行纠错，Corrected reads路径位于./17s1XX/1-consensus/cns_iter${NUM_ITER}/cns.fasta.

Step 3 组装

necat.pl assemble ecoli_config.txt

针对纠错后的reads进行组装，如果么有纠错，则自动进行纠错步骤.

运行结果位于./17s1XX/4-fsa/contigs.fasta.

Step 4 Bridge contigs

necat.pl bridge ecoli_config.txt

结果位于：./17s1XX/6-bridge_contigs/bridged_contigs.fasta.

如果设置了POLISH_CONTIGS，则会利用纠错后的reads 对bridged contigs进行polish。

结果位于：6-bridge_contigs/polished_contigs.fasta

多节点计算

如果使用的是PBS或者SGE系统，可以设置配置文件中的如下参数进行多节点运行

USE_GRID=true

GRID_NODE=4

欢迎扫码交流

NECAT组装ONT long reads的更多相关文章

NextDenovo 组装基因组
NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-100X数据更有效),可通过correct--assemble对其进行组装.组装后,每个碱 ...
基因组 de novo 组装原理
Falcon软件的组装流程为了错误校正,将原始子reads进行overlap 预组装和错误校正错误校正后reads的overlap检测 overlap的过滤从overlap构建图从图构建con ...
转录本组装软件StringTie的使用说明
转录本组装软件StringTie的使用说明 StringTie 转录本组装软件StringTie的使用说明转录组分析流程 HISTA + StringTie 组合.其Protocol 发表在Natu ...
转录组组装软件stringtie
StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件. ...
Falcon：三代reads比对组装工具箱
主页:github: PacificBiosciences/FALCON 简介 Falcon是一组通过快速比对长reads,从而来consensus和组装的工具. Falcon工具包是一组简单的代码集 ...
PacBio长reads的大基因组组装
原文链接:Large Genome Assembly with PacBio Long Reads 可以以多种方式利用PacBio长reads来生成和改进大型基因组的de novo组装. 你可以用几种 ...
三代PacBio reads纠错 - 专题
三代纠错的重要性不言而喻,三代的核心优势就是长,唯一的缺点就是错误率高,但好就好在错误是随机分布的,可以通过算法解决,这也就是为什么现在有这么多针对三代开发的纠错工具. 纠错和组装是分不开的,纠错就是 ...
PBcR - 纠错及组装算法
单分子测序reads(PB)的混合纠错和denovo组装我们广泛使用的PBcR的原始文章就是这一篇原文链接:Hybrid error correction and de novo assembly ...
用单分子测序（single-molecule sequencing）和局部敏感哈希（locality-sensitive hashing）来组装大型基因组
Assembling large genomes with single-molecule sequencing and locality-sensitive hashing 好好读读,算法系列的好文 ...

随机推荐

BUAA-软件工程-个人总结与心得
提问回顾以及个人总结项目内容这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰任健) 这个作业的要求在哪里提问回顾与个人总结我在这个课程的目标是学习软件开发的过程,团队之间的写作 ...
大闸蟹的项目分析——CSDN APP
大闸蟹的软件案例分析项目内容这个作业属于那个课程班级博客这个作业的要求在哪里作业要求我在这个课程的目标是学习软件工程的相关知识这个作业在哪个具体方面帮我实现目标从多角度分析软件一 ...
Vue3+Typescript+Node.js实现微信端公众号H5支付(JSAPI v3)教程--各种填坑
----微信支付文档,不得不说,挺乱!(吐槽截止) 功能背景微信公众号中,点击菜单或者扫码,打开公众号中的H5页面,进行支付. 一.技术栈前端:Vue:3.0.0,typescript:3.9.3 ...
js_数据类型转换
转整数----parseInt(string,radix) 1)类似于从左往右匹配数字,直到匹配到非数字结束,并返回匹配到的数字.同parseFloat(). parseInt("123&q ...
「刷题」THUPC泛做
刷了一下,写一下. T1. 天天爱射击可以这样想. 我们二分一下每一块木板在什么时刻被击碎. 然后直接用主席树维护的话是$O(nlog^2n)$的. 会$T$,而且是一分不给那种... 那么 ...
2021.9.13考试总结[NOIP模拟52]
T1 路径考虑每一位的贡献,第$i$位每$2^i$个数会变一次,那么答案为$\sum_{i=1}^{log_2n} \frac{n}{2^i}$. $code:$ 1 #include<bit ...
Manacher(马拉车)
Able was I ere I saw Elba. ----Napoléon Bonaparte(拿破仑) 一.回文串&回文子串这个很好理解. 如果一个字符串正着读和反着读是一 ...
MIPI归纳---为什么阻抗为100欧姆
根据LVDS(Low Voltage Differential Signaling)电平定义的. LVDS差分信号PN两线最大幅度是350mV,内部一个恒流源电流是3.5mA.于是终端匹配电阻是100 ...
advanced base-scripting guide in chinese（高级Bash脚本编程指南-10)
<高级Bash脚本编程指南>Revision 10中文版 github上链接地址: https://github.com/LinuxStory/Advanced-Bash-Scriptin ...
全志Linux Tina编译demoOmxVdec错误
测试裸流 Making install in demoOmxVdec make[6]: Entering directory '/home/liuxueneng/WorkCode/Homlet-Tin ...

NECAT组装ONT long reads

安装

简单使用

Step 1 配置文件

Step 2 correct raw reads

Step 3 组装

Step 4 Bridge contigs

多节点计算

欢迎扫码交流

NECAT组装ONT long reads的更多相关文章

随机推荐

热门专题