[转记]MAFFT多重序列比对图解教程

【絮语】

  一提到多重序列比对,很多人禁不住就想到ClustalW(Clustalx为ClustalW的GUI版),其实有一款多重序列比对软件-MAFFT,不论从比对速度(Muscle>MAFFT>ClustalW>T-Coffee),还是比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)来说,其相比于ClustalW(或ClustalX)有过之而无不及,所以这里强烈推荐使用MAFFT这款多重比对软件。
   PS: 不同比对软件的比较,有兴趣的童鞋可以下载这篇文章看看:Alignment uncertainty and genomic analysis. Science, 2008
   MAFFT官方网站:http://mafft.cbrc.jp/alignment/software/
  支持平台:Mac OS X 、Linux、Windows 
  Windows 32位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win32.zip,64位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win64.zip,请根据自己操作系统选择相应版本下载。

                   图1 MAFFT主界面
  简明操作流程:
  1.载入序列文件  将FASTA格式的待比对序列文件(如:TMV.fas) 复制MAFFT的根目录下(当然也可以放任意位置,只有找得到),双击“mafft.bat”启动MAFFT,此时提示输入文件(Input file?),在@后面输入示例的TMV.fas,也可以直接将文件拖入窗口(注意有个+,说明当前是拖放状态),如下图所示:

  加载后回车,当显示“OK”时说明载入文件成功。

  2.设置输出信息  
  输出文件名称自定义,扩展名任意,这里保留原扩展名,输出文件名为TMV-out.fas,确定后回车。
  输出文件格式,建议用3或4,这里在@后输入4后回车,此时出现 MAFFT三种主要比对策略的5个选项,如下图:

  当你无法确定时候,建议用第1种的--auto模式,让MAFFT根据序列的特点自动选择相应的比对策略,输入1后回车。
  当不需要附带参数时,直接回车。
  3.开始多重比对
  一切设置完毕,输入“Y”回车,程序自动开始比对。


  当出现输出文件名,说明比对完成。

  4.后续着色美化 详见附录,不再赘述

附:多重序列比对的后期着色渲染
(1) Boxshade (黑白着色),在线网址:http://www.ch.embnet.org/software/BOX_form.html相关使用教程,请网上搜索本人写的《序列着色软件Boxshade图解教程(by raindy)》;
(2) ESPript 彩色着色,在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi,效果图:

(3)TeXShade 自定义着色,详见日志: http://user.qzone.qq.com/58001704/blog/1367885081


附: 多序列比对的可视化显示
 
可能因为毕业论文内容论文需要,最近很多人都找我帮忙将clustal的序列比对文件结果可视化,现将TEXshade软件包能做出来的可视化效果分享给各位同学,因为使用TEXshade涉及到了一些LATEX知识,所以需要更深入的了解如何运作请给我留言或者私聊,此文仅将软件能做出的效果展示,虽然其实软件很简单,但不做具体使用说明,我的风格通常是授人以鱼,不授人以渔。

最简单的莫过于纯粹的多序列比对排版,跟某些同学论文里面用Word排版的效果类似(word里面需要用等宽字体),效果类似如下:

如果稍微加点效果可能就变成了如下的样子,我们将相同的氨基酸标记出来:

当然,TEXshade能做的不仅仅是这些,下面这张图我们标记了其中的几个关键位置,去掉了右侧的“ruler”

好像这个样子就有点乱了

下面这幅就更详细一点了,我用不同的颜色代表了不同的conservation

很多情况下,我们只想呈现多序列中的某些突变位点,其实也可以很好的表达

如果将T-Coffee 的 score_ascii 文件一并输入TEXshade,效果我觉得很帅气
 

我遇到过很多可视化表达各种结构域的例子,下面的表示是不是很帅呢?

下面是另外的一些功能实例

下面的被称为Sequence fingerprints,其实加上fingerprint命令就可以直接出图了。

很早的时候,看到序列的LOGO图觉得很帅气,下面的Logo图你见过么?

下面再给大家分享几个例子,其实TEXshade能做的很多,要靠大家的想象,我一向认为,只要人能想得出,数据可视化就能做得到。


所属相册:数据可视化

其实很多人都会觉得这么漂亮的图肯定做出来很复杂,其实TEXShade需要的很简单,输出上面的结果其实也就是几分钟的事情,前提是需要你准备好需要展示的序列,记录好要标注的位置就OK!

例如:对于下面这个看似复杂的可视化结果,其实我们需要的代码很少,只需要5行代码就足够了!

上图对应的TEX代码:

第一行指定了我们的输入文件,通常是比对的结果文件
第二行是指定了TEXshade的显示模式,这里用根据 不同 functional groups的chemical properties标注颜色
第三行是表示只显示第一条序列(AQP1.PRO)138-170个碱基范围
第四号表示显示 legend
第五行表示代码结束

本文引用地址:http://blog.sciencenet.cn/blog-460481-706083.html 此文来自科学网高芳銮博客,转载请注明出处。 

个人分类:软件教程|系统分类:科研笔记|关键词:MAFFT 多重比对

MAFFT多重序列比对--(附比对彩标方法)的更多相关文章

  1. Jquery各版本下载,附Jquery官网下载方法

    jQuery version 2.1.1 http://ajax.aspnetcdn.com/ajax/jQuery/jquery-2.1.1.js http://ajax.aspnetcdn.com ...

  2. Idea for Mac 过期 IntelliJ IDEA 2017 完美注册方法(附idea for Mac破解方法)

    Idea 不能使用了: 开始破解: (1)首先下载 jar包: https://download.csdn.net/download/engerla/10573069 放到位置: /Applicati ...

  3. Eclipse、MinGW、JNI编写C++生成dll, Java端调用的完整示例(附java.lang.UnsatisfiedLinkError解决方法)

     Eclipse.MinGW.JNI编写C++生成dll, Java端调用的完整示例(附java.lang.UnsatisfiedLinkError解决方法) 问题背景:之前的JNI编程都是基于And ...

  4. jQuery视差滚动插件,(附原理分析,调用方法)

    演示地址:http://www.jq22.com/jquery-info1799 jquery插件,使用验证过可用. 分析源代码后总结原理:设置background样式为fixed,判断浏览器滚动距离 ...

  5. 警告1909。无法创建快捷方式VMware Workstation Pro.Ink。解决方法(附 VMware_workstation 12的安装方法)

    电脑之前装过VMware 10,很长时间没用就卸载了,也没有在意卸载的干不干净,直到最近需要用Linux系统,重新安装了VMware 12,就出现下面这样的情况: 警告1909.无法创建快捷方式VMw ...

  6. 如何将mysql表结构导出成Excel格式的(并带备注)另附转为word表格的方法

    方法一: 1.使用一个MySQL管理工具:SQLyog,点击菜单栏“数据库”下拉的最后一项: 导出的格式如下: 2.要想转成Excel格式的只需手动将该表复制到Excel中去. 方法二: 1.以下用的 ...

  7. 去除底部“自豪地采用 WordPress”版权信息----最后附最新版的删除方法!!

    footer.php get_template_part( 'template-parts/footer/site', 'info' );

  8. Django之组合搜索组件(二)--另附simple_tag的创建使用方法

    这次的代码为Django之组合搜索组件(一)的改版,实现的结果和(一)相同,不同的是,这次运用simple_tag方式,使.html程序简化 所以现在就开始编程吧! 首先想使用simple_tag方法 ...

  9. Springboot第二篇:与前端fetch通信(附springboot解决跨域方法)

    说到与前端通信,明白人都知道这章肯定会写两部分的东西啦. 关于后台 ①首先回顾前文,上一章环境搭建如图: ②我们在maven.example.controller下添加一个文件,并附上如图代码: ③: ...

随机推荐

  1. 【BZOJ 1023】【SHOI 2008】cactus仙人掌图

    良心的题解↓ http://z55250825.blog.163.com/blog/static/150230809201412793151890/ tarjan的时候如果是树边则做树形DP(遇到环就 ...

  2. 【USACO 1.3】Barn Repair

    贪心,去掉最大的min(m,c)-1个间隔 /******************************************* TASK: barn1 LANG: C++ Created Tim ...

  3. Maven项目自动生成mybaties配置文件

    1.把mysql-connector-java-5.1.31.jar包放到C盘的mysqljar文件夹下 2.在generatorConfig.xml文件中配置实体.dao.service等包 < ...

  4. Spark MLib 基本统计汇总 2

    4. 假设检验 基础回顾: 假设检验,用于判断一个结果是否在统计上是显著的.这个结果是否有机会发生. 显著性检验 原假设与备择假设 常把一个要检验的假设记作 H0,称为原假设(或零假设) (null ...

  5. Leetcode Move Zeros

    Given an array nums, write a function to move all 0's to the end of it while maintaining the relativ ...

  6. Leetcode 130. Surrounded Regions

    Given a 2D board containing 'X' and 'O' (the letter O), capture all regions surrounded by 'X'. A reg ...

  7. BLOG搬家

    前段时间一直用的新浪blog,发现推送信息是否杂乱,所以特地投奔学长CSDN,外加之前颓废心过重,现在打算新面貌认真学习

  8. VS中的代码段功能

    1.前言 开发人员不喜欢打字.如果你希望提高开发人员的生产力,减少键入的数量,这也同时减少打字稿的数量以及因此产生的编译器错误,这些都极大分散了开发人员的注意力.代码重用是开发人员收集代码的另一个原因 ...

  9. BZOJ1853 [Scoi2010]幸运数字

    本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000作者博客:http://www.cnblogs.com/ljh2000-jump/转 ...

  10. Python基础0:变量 赋值 表达式和运算符

    变量: 前面我们在使用print()输出内容的时候,如果内容很长,后面要再次输出的时候,就需重新在输入一遍. 如果给输出的内容起个简单的别名.这样我们用简短的别名来代替长内容,下次要输出的时候就直接使 ...