1.常用HiC挂载软件

  • ALLHiC

    张兴坦老师专为多倍体和高杂合度物种基因组挂载开发。如果是复杂基因组,肯定是首选。对于简单基因组,我跑了下,结果不佳。提了issue,张老师特意开发了个为简单基因组设计的流程:https://github.com/tangerzhang/ALLHiC/blob/master/bin/ALLHiC_pip.sh,主要增加了对contig的纠错。至于效果,我还在跑。

  • 3D-DNA

    优秀的纠错功能。我认为既是优点,也是缺点。它会把你原来完整的contig拆的稀碎,认为那些不准确,需要通过染色质交互来矫正。得到的结果也是五花八门,占的空间太大了!又不敢轻易删掉,因为有些文件你在手工纠错后还要用到。

    默认迭代纠错2次,根据我的折腾,你最好还是0.hic、1.hc和2.hc都试下吧,导入juice_box看下效果,哪个好就用哪个。我同时组装了两个基因组,一个是0.hic最好,另一个是1.hc最好。这个软件就很玄学,用不同的结果可能错误率差别很大。

  • LACHESIS

    经典软件,有效聚类和排序,现在发表的大部分HiC挂载文章都出自于它。但不适合多倍体和高杂合度的基因组,2017年就不再更新。

    因为很旧,安装过程非常痛苦,源码安装,samtools和boost版本都要求很老。费了很大的功夫安装成功了,运行过程却总是出现:Segmentation fault (core dumped),作者在GitHub issue上提供了解决方法(ubuntu),但对我不适用。最后放弃,建议大家也不要再用了。

  • SALSA2

    使用简单,精确度高(比3d-dna)。但存在聚类错误,调整难度大。

主要是以上四个,其他小众的软件更不推荐。

2. Juice_box手工纠错

这些软件的结果最后还是要进行手工纠错,真的太原始太不智能了!人依赖于软件,软件却始终不如人。使用的是Juice_box来进行可视化纠错,然而,这个软件的文档写得非常简单,youtube上官方视频也非常之简短(七八分钟)。有人把它搬到了b站,还带字幕。翻译 | Juicebox Assembly Tools教程。具体怎么使用,需要自己去折腾,很恼火。我简单说下关键的操作:

  • 所有纠错操作都基于shift键
  • 操作不熟练,你可能需要反复undo和redo(右键)
  • 选框时,你只要在本框范围内拖动(按shift不要松),都会选中这个框(选中后为带黑黄色的线),并不要很精确地选在框边缘(因为你把握不好,有可能这个边缘是另一个框的范围,这时就会选错)
  • 选择框时,尽可能放大(双击,或菜单栏BP,一般25kb-50kb)
  • 如果你的染色体数目不对。拆分染色体:先选中要拆分区域,右击add染色体,再选中,右击remove染色体

  • 从某一个地方剪掉框:选中,出现剪刀符号,单击
  • 旋转框:选中,出现旋转符号,单击
  • 从一个地方移动:选中,鼠标移到要插入的contig框顶点,单击

暂时想到有用的操作就这么多,就是要反复看官方那个视频,然后尝试才能搞懂。B站上还有一个讲解的视频:20200908_FGL_利用Hic技术组装染色体,不过也不是很详细。

Juice_box调图是个细致的体力活。一想到我的基因组是这么人为调出来的,我自己对结果都产生了怀疑。

如果是3D-DNA,再简单的基因组也还是会有很多碎的,因为它手贱重新打碎了。所以说如果你原始组装的contig数目比3d-dna跑出的FINAL.fasta中的contig数目少,甚至比手工纠错后再跑3D-DNA的数目少,也不要感到惊讶。反正我是越纠越差,基因组越来越小。可能是我不会调细节吧,再次吐槽,这个软件我是真的讨厌。

【基因组组装】HiC挂载软件以及如何用Juice_box手工纠错?的更多相关文章

  1. 【基因组组装】HiC挂载Juicebox纠错补充

    目录 1. 主要纠错类型 misjoins translocations inversions chromosome boundaries 2. 其他有用操作 撤销与反撤销 移到边角料 1. 主要纠错 ...

  2. 基因组Denovo组装原理、软件、策略及实施

    目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...

  3. 基因组组装工具之 SOAPdenovo 使用方法

    SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图. 该软件特地设计用来组装Illumina GA short reads,新的版本减少了在图 ...

  4. PacBio长reads的大基因组组装

    原文链接:Large Genome Assembly with PacBio Long Reads 可以以多种方式利用PacBio长reads来生成和改进大型基因组的de novo组装. 你可以用几种 ...

  5. Pacbio三代基因组组装简介

    参考: 视频PPT来自欧易生物讲座:如何开启一个动植物基因组三代de novo项目?

  6. SOAPdenovo组装软件使用记录

    背景: 1.为什么要从头测序组装基因组? 基因组是不同表型的遗传基础:获得参考基因组是深入研究一个生物体全基因组的第一步也是必须的一步:从头测序组装能够对新的测序物种构建参考基因组: 2.为什么要研究 ...

  7. PacBio全基因组测序和组装

    PacBio公司的业务范围也就5个(官网): Whole Genome Sequencing Targeted Sequencing Complex Populations RNA Sequencin ...

  8. Pacbio 纯三代组装复活草基因组

    对于植物等真核生物基因组来说,重复序列, 多倍体,高杂合度等特征在利用二代数据进行组装的时候都会有很大的问题: 利用二代数据组装出来的基因组,大多达不到完成图的水准,通常只是覆盖到编码蛋白的基因区域, ...

  9. 【转】NG:垂枝桦基因组图谱构建(2+3组装)及重测序分析

    转自希望组公众号.学习二代+三代组装策略的流程 垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工.家具等,经济价值极高.近日,芬兰研究人员对垂枝桦自交系 ...

随机推荐

  1. Java中类及方法的加载顺序

    1. 虚拟机在首次加载Java类时,会对静态代码块.静态成员变量.静态方法进行一次初始化(静态间按顺序执行). 2. 只有在调用new方法时才会创建类的实例. 3. 类实例创建过程:父子继承关系,先父 ...

  2. 万维网www与HTTP协议

    文章转自:https://blog.csdn.net/weixin_43914604/article/details/105901440 学习课程:<2019王道考研计算机网络> 学习目的 ...

  3. readelf

    readelf的help内容如下所示: Usage: readelf <option(s)> elf-file(s) Display information about the conte ...

  4. 从拥有一个阿里云账号开始使用Maxcompute

    本教程并不会创建子账户来管理maxcompute,是直接使用主账号来对maxcompute进行管理(强烈不推荐在生产环境中这样做!!) Step1:创建阿里云账号并实名认证 ​ 创建一个阿里云账号(使 ...

  5. 记一次CTF比赛过程与解题思路-MISC部分

    前言 最近好久没更新博客和公众号了,有朋友问是不是在憋大招,但我不好意思说其实是因为最近一段时间太懒了,一直在当咸鱼- 意识到很久没更新这个问题,我是想写点什么的,但好像一直当咸鱼也没啥可分享的,最近 ...

  6. 使用jax加速Hamming Distance的计算

    技术背景 一般认为Jax是谷歌为了取代TensorFlow而推出的一款全新的端到端可微的框架,但是Jax同时也集成了绝大部分的numpy函数,这就使得我们可以更加简便的从numpy的计算习惯中切换到G ...

  7. 为什么Hashtab的大小通常取远离2^n 的素数

    举个栗子 在Hashtab中我们通常 Hash(key) % M 来确定 key 所需要存放的位置 M就是Hashtab的大小,假设下面的两个场景 Hash(key1) = 108 Hash(key2 ...

  8. RabbitMQ的安装及入门使(Windows)

    1.安装Erlang所以在安装rabbitMQ之前,需要先安装Erlang .点击下载Erlang 执行下载下来的Erlang,全部点击"下一步"就行.安装完成设置一下环境变量. ...

  9. Java测试开发--Maven用法(三)

    一.Maven简介 Maven 是java项目构建工具,统一包的管理,统一项目管理.项目编译,测试打包.部署. 二.Maven工程搭建: 1.新建maven工程,如下图 2. 新建工程后,jdk使用的 ...

  10. Part 1 to 10 Basic in C#

    Part 1 Introduction The struct of C# program: namespace , class and Main method what is namespace? t ...