1.常用HiC挂载软件

  • ALLHiC

    张兴坦老师专为多倍体和高杂合度物种基因组挂载开发。如果是复杂基因组,肯定是首选。对于简单基因组,我跑了下,结果不佳。提了issue,张老师特意开发了个为简单基因组设计的流程:https://github.com/tangerzhang/ALLHiC/blob/master/bin/ALLHiC_pip.sh,主要增加了对contig的纠错。至于效果,我还在跑。

  • 3D-DNA

    优秀的纠错功能。我认为既是优点,也是缺点。它会把你原来完整的contig拆的稀碎,认为那些不准确,需要通过染色质交互来矫正。得到的结果也是五花八门,占的空间太大了!又不敢轻易删掉,因为有些文件你在手工纠错后还要用到。

    默认迭代纠错2次,根据我的折腾,你最好还是0.hic、1.hc和2.hc都试下吧,导入juice_box看下效果,哪个好就用哪个。我同时组装了两个基因组,一个是0.hic最好,另一个是1.hc最好。这个软件就很玄学,用不同的结果可能错误率差别很大。

  • LACHESIS

    经典软件,有效聚类和排序,现在发表的大部分HiC挂载文章都出自于它。但不适合多倍体和高杂合度的基因组,2017年就不再更新。

    因为很旧,安装过程非常痛苦,源码安装,samtools和boost版本都要求很老。费了很大的功夫安装成功了,运行过程却总是出现:Segmentation fault (core dumped),作者在GitHub issue上提供了解决方法(ubuntu),但对我不适用。最后放弃,建议大家也不要再用了。

  • SALSA2

    使用简单,精确度高(比3d-dna)。但存在聚类错误,调整难度大。

主要是以上四个,其他小众的软件更不推荐。

2. Juice_box手工纠错

这些软件的结果最后还是要进行手工纠错,真的太原始太不智能了!人依赖于软件,软件却始终不如人。使用的是Juice_box来进行可视化纠错,然而,这个软件的文档写得非常简单,youtube上官方视频也非常之简短(七八分钟)。有人把它搬到了b站,还带字幕。翻译 | Juicebox Assembly Tools教程。具体怎么使用,需要自己去折腾,很恼火。我简单说下关键的操作:

  • 所有纠错操作都基于shift键
  • 操作不熟练,你可能需要反复undo和redo(右键)
  • 选框时,你只要在本框范围内拖动(按shift不要松),都会选中这个框(选中后为带黑黄色的线),并不要很精确地选在框边缘(因为你把握不好,有可能这个边缘是另一个框的范围,这时就会选错)
  • 选择框时,尽可能放大(双击,或菜单栏BP,一般25kb-50kb)
  • 如果你的染色体数目不对。拆分染色体:先选中要拆分区域,右击add染色体,再选中,右击remove染色体

  • 从某一个地方剪掉框:选中,出现剪刀符号,单击
  • 旋转框:选中,出现旋转符号,单击
  • 从一个地方移动:选中,鼠标移到要插入的contig框顶点,单击

暂时想到有用的操作就这么多,就是要反复看官方那个视频,然后尝试才能搞懂。B站上还有一个讲解的视频:20200908_FGL_利用Hic技术组装染色体,不过也不是很详细。

Juice_box调图是个细致的体力活。一想到我的基因组是这么人为调出来的,我自己对结果都产生了怀疑。

如果是3D-DNA,再简单的基因组也还是会有很多碎的,因为它手贱重新打碎了。所以说如果你原始组装的contig数目比3d-dna跑出的FINAL.fasta中的contig数目少,甚至比手工纠错后再跑3D-DNA的数目少,也不要感到惊讶。反正我是越纠越差,基因组越来越小。可能是我不会调细节吧,再次吐槽,这个软件我是真的讨厌。

【基因组组装】HiC挂载软件以及如何用Juice_box手工纠错?的更多相关文章

  1. 【基因组组装】HiC挂载Juicebox纠错补充

    目录 1. 主要纠错类型 misjoins translocations inversions chromosome boundaries 2. 其他有用操作 撤销与反撤销 移到边角料 1. 主要纠错 ...

  2. 基因组Denovo组装原理、软件、策略及实施

    目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...

  3. 基因组组装工具之 SOAPdenovo 使用方法

    SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图. 该软件特地设计用来组装Illumina GA short reads,新的版本减少了在图 ...

  4. PacBio长reads的大基因组组装

    原文链接:Large Genome Assembly with PacBio Long Reads 可以以多种方式利用PacBio长reads来生成和改进大型基因组的de novo组装. 你可以用几种 ...

  5. Pacbio三代基因组组装简介

    参考: 视频PPT来自欧易生物讲座:如何开启一个动植物基因组三代de novo项目?

  6. SOAPdenovo组装软件使用记录

    背景: 1.为什么要从头测序组装基因组? 基因组是不同表型的遗传基础:获得参考基因组是深入研究一个生物体全基因组的第一步也是必须的一步:从头测序组装能够对新的测序物种构建参考基因组: 2.为什么要研究 ...

  7. PacBio全基因组测序和组装

    PacBio公司的业务范围也就5个(官网): Whole Genome Sequencing Targeted Sequencing Complex Populations RNA Sequencin ...

  8. Pacbio 纯三代组装复活草基因组

    对于植物等真核生物基因组来说,重复序列, 多倍体,高杂合度等特征在利用二代数据进行组装的时候都会有很大的问题: 利用二代数据组装出来的基因组,大多达不到完成图的水准,通常只是覆盖到编码蛋白的基因区域, ...

  9. 【转】NG:垂枝桦基因组图谱构建(2+3组装)及重测序分析

    转自希望组公众号.学习二代+三代组装策略的流程 垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工.家具等,经济价值极高.近日,芬兰研究人员对垂枝桦自交系 ...

随机推荐

  1. Java-基础-ArrayList

    1. 简介 ArrayList 实现了 List 接口,其底层基于数组实现容量大小动态可变.既然是数组,那么元素存放一定是有序的,并允许包括 null 在内的所有元素. 每个 ArrayList 实例 ...

  2. oo第三单元学习总结

    OO第三单元小结 一.JML语言理论基础及工具链梳理 在本单元我们学习了JML语言的一些基础知识,能够让我们看懂简单的JML规格并写出对应代码, 主要用到的知识点有:   1.requires 该子句 ...

  3. Vue 报错Error in render: “TypeError: Cannot read properties of null (reading ‘xxx’)” found in

    前端vue报错 [Vue warn]: Error in render: "TypeError: Cannot read properties of null (reading 'name' ...

  4. skywalking实现分布式系统链路追踪

    一.背景 随着微服务的越来越流行,我们服务之间的调用关系就显得越来越复杂,我们急需一个APM工具来分析系统中存在的各种性能指标问题以及调用关系.目前主流的APM工具有CAT.Zipkin.Pinpoi ...

  5. Mysql的入门和连接问题

    Mysql的连接问题 最近学完了mysql的基础语法,基本上是掌握了mysql的简单运用. 1.入门mysql 我是通过看<漫画sql>入门的,这个视频案例很到位,跟着2倍速学前9章就可以 ...

  6. MySQL 的架构与组件

    MySQL 的逻辑架构图设计图 连接/线程处理:管理客户端连接/会话[mysql threads] 解析器:通过检查SQL查询中的每个字符来检查SQL语法,并为每个SQL查询生成  SQL_ID. 此 ...

  7. MD5函数(公共方法)

    1 #region MD5函数 2 /// <summary> 3 /// MD5函数 4 /// </summary> 5 /// <param name=" ...

  8. 像素设定 牛客网 程序员面试金典 C++ Python

    像素设定 牛客网 程序员面试金典 题目描述 有一个单色屏幕储存在一维数组中,其中数组的每个元素代表连续的8位的像素的值,请实现一个函数,将第x到第y个像素涂上颜色(像素标号从零开始),并尝试尽量使用最 ...

  9. Nginx多种安装方式

    不指定参数配置的Nginx编译安装 ./configuremake make install wget下载或浏览器下载上传.解压进入目录[root@mcw1 nginx-1.10.2]# ls #查看 ...

  10. 折腾systemd-nspawn运行centos7

    Archlinux创建Debian/Ubuntu的systemd-nspawn容器是很简单的,因为有debootstrap软件.某天我突然想装个centos7玩玩,搜了半天没发现有什么类似于deboo ...