软件简介

MCScanX工具集对MCScan算法进行了调整,用于检测共线性和同线性区域,还增加了可视化和下游分析。。MCscanX有三个核心工具,以及12个下游分析工具。

软件安装

进入官网http://chibba.pgml.uga.edu/mcscan2/#tm,下载安装

1 unzip MCscanX.zip
2 cd MCScanX
3 make

软件使用

  • 所需要文件

     两个或多个物种的gff文件,蛋白序列(** 该软件最多能做5个物种的共线性

  • 第一步:构建索引,进行blastp比对

注意!这里是找at和vv两个基因组组内和组间的共线性,因为想同时知道物种内和物种间的共线性,所以在blast之前把at和vv的基因组facat到一起,既做database,又做query,如果只想知道组间的共线性,那么就任取一个基因组为database,另一个做query
注意! 如果一个基因有多个转录本,只选择注释中的第一条
1 ## 合并
2 cat at.fa vv.fa >>all.fa
3
4 ## 建库
5 makeblastdb -in all.fa -dbtype prot -out index/all -parse_seqids
6
7 ## 比对
8 blastp -query all.fa -db index/all -out all.blast -evalue 1e-5 -num_threads 10 -outfmt 6 -num_alignments 5
  • 第二步:构建gff文件

MCscanX要求的gff文件和标准的gff文件不一样,它只有四列, 其中"sp#"的sp意味着你要用2个字母代表物种,#则表示是哪条染色体。而"gene"则要是你蛋白序列的基因名

注意:all.gff, all.blastp 前缀需要一样,并且在同一文件夹下
1 sp# gene    starting_position  ending_position

根据物种的gff3文件利用awk 快速得到MCscanX要求的gff文件

  • 第三步:MCScanX寻找共线性区块

1 MCScanX ./all
  • 结果文件

输出文件分为两个:

        第一个是at_rice.collinearity, 记录着共线性区块(collinear blocks), 可以选择共线性区块基因大于10以上为可信区域

        第二个是一个网页格式

  • 输出共线性基因的位置信息

  •  1 #!/usr/bin/env python
    2 # _*_ coding: utf-8 _*_
    3
    4 import sys,re
    5
    6 gene_info = {}
    7 syn_info = {}
    8
    9 IN = sys.argv[1] ##*.gff
    10 IN1 = sys.argv[2] ## *.collinearity
    11 IN2 = sys.argv[3] ## number,int;
    12
    13 with open(IN) as f,\
    14 open(IN1) as f1,\
    15 open("%s_syn_region_info" %IN.strip(".gff"),"w") as o:
    16 for i in f:
    17 i=i.strip().split()
    18 gene_info[i[1]] = [i[0],i[2],i[3]]
    19 for x in f1:
    20 if '## Alignment' in x:
    21 res=x.strip()
    22 if res not in syn_info:
    23 syn_info[res] = []
    24 elif '#' not in x:
    25 x=x.strip().split()
    26 tem = x[-3]+"&&"+x[-2]
    27 syn_info[res].append(tem)
    28 for k,v in syn_info.items():
    29 num = re.search(r" N=(\d+) ",k).group(1)
    30 if int(num) >= 10:
    31 for n in v:
    32 # print n
    33 gene1 = n.split("&&")[0]
    34 gene2 = n.split("&&")[1]
    35 gene1_chr = gene_info[gene1][0]
    36 gene1_start = gene_info[gene1][1]
    37 gene1_end = gene_info[gene1][2]
    38 gene2_chr = gene_info[gene2][0]
    39 gene2_start = gene_info[gene2][1]
    40 gene2_end = gene_info[gene2][2]
    41 o.write("%s\t%s\t%s\t%s\t%s\t%s\t%s\t%s\n"%(gene1_chr,gene1,gene1_start,gene1_end,gene2,gene2_chr,gene2_start,gene2_end))

基因组共线性工具MCScanX使用说明

基因组共线性工具MCScanX使用说明

------END------

关注下方公众号可获得更多精彩

基因组共线性分析工具MCScanX的更多相关文章

  1. 史上最全 | 39个RNAseq分析工具与对比

    文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the ...

  2. OS Tools-GO富集分析工具的使用与解读详细教程

    我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍:       Gene Ontology(简称G ...

  3. Android代码分析工具lint学习

    1 lint简介 1.1 概述 lint是随Android SDK自带的一个静态代码分析工具.它用来对Android工程的源文件进行检查,找出在正确性.安全.性能.可使用性.可访问性及国际化等方面可能 ...

  4. 【转】gc日志分析工具

    性能测试排查定位问题,分析调优过程中,会遇到要分析gc日志,人肉分析gc日志有时比较困难,相关图形化或命令行工具可以有效地帮助辅助分析. Gc日志参数 通过在tomcat启动脚本中添加相关参数生成gc ...

  5. Java 性能分析工具 , 第 3 部分: Java Mission Control

    引言 本文为 Java 性能分析工具系列文章第三篇,这里将介绍如何使用 Java 任务控制器 Java Mission Control 深入分析 Java 应用程序的性能,为程序开发人员在使用 Jav ...

  6. Java 性能分析工具 , 第 2 部分:Java 内置监控工具

    引言 本文为 Java 性能分析工具系列文章第二篇,第一篇:操作系统工具.在本文中将介绍如何使用 Java 内置监控工具更加深入的了解 Java 应用程序和 JVM 本身.在 JDK 中有许多内置的工 ...

  7. Java 性能分析工具 , 第 1 部分: 操作系统工具

    引言 性能分析的前提是将应用程序内部的运行状况以及应用运行环境的状况以一种可视化的方式更加直接的展现出来,如何来达到这种可视化的展示呢?我们需要配合使用操作系统中集成的程序监控工具和 Java 中内置 ...

  8. 系统级性能分析工具perf的介绍与使用

    测试环境:Ubuntu16.04(在VMWare虚拟机使用perf top存在无法显示问题) Kernel:3.13.0-32 系统级性能优化通常包括两个阶段:性能剖析(performance pro ...

  9. KRPano资源分析工具使用说明(KRPano XML/JS解密 切片图批量下载 球面图还原 加密混淆JS还原美化)

    软件交流群:571171251(软件免费版本在群内提供) krpano技术交流群:551278936(软件免费版本在群内提供) 最新博客地址:blog.turenlong.com 限时下载地址:htt ...

随机推荐

  1. Java:并发笔记-05

    Java:并发笔记-05 说明:这是看了 bilibili 上 黑马程序员 的课程 java并发编程 后做的笔记 4. 共享模型之内存 本章内容 上一章讲解的 Monitor 主要关注的是访问共享变量 ...

  2. [敏捷软工团队博客]Beta设计和计划

    项目 内容 2020春季计算机学院软件工程(罗杰 任健) 博客园班级博客 作业要求 Beta设计和计划 我们在这个课程的目标是 在团队合作中锻炼自己 这个作业在哪个具体方面帮助我们实现目标 对Beta ...

  3. netty传输java bean对象

    在上一篇博客(netty入门实现简单的echo程序)中,我们知道了如何使用netty发送一个简单的消息,但是这远远是不够的.在这篇博客中,我们来使用netty发送一个java bean对象的消息,但是 ...

  4. 微信小程序实现tabs选项卡

    选项卡在我们的日常开发中,使用的还是蛮多的,但是微信小程序中却没有直接提供选项卡组件,不过我们可以变通通过 scroll-view 和 swiper 组件来实现一个选项卡的功能. 需求: 实现一个选项 ...

  5. postman_参数关联

    注:postman中的参数引用符号是{{变量名}},两个大括号 1.创建登录接口请求,在Tests中,添加如下代码,并send: // 获取响应的json数据 var jsonData = pm.re ...

  6. 单源最短路径算法:迪杰斯特拉 (Dijkstra) 算法(二)

    一.基于邻接表的Dijkstra算法 如前一篇文章所述,在 Dijkstra 的算法中,维护了两组,一组包含已经包含在最短路径树中的顶点列表,另一组包含尚未包含的顶点.使用邻接表表示,可以使用 BFS ...

  7. [WPF] 在 Windows 11 中处理 WindowChrome 的圆角

    1. Windows 11 的圆角 在直角统治了微软的 UI 设计多年以后,微软突然把直角骂了一顿,说还是圆角好看,于是 Windows 11 随处都可看到圆角设计.Windows 11 使用 3 个 ...

  8. springboot入门之版本依赖和自动配置原理

    前言 Spring Boot makes it easy to create stand-alone, production-grade Spring based Applications that ...

  9. webpack 提取css成单独文件

    webpack 提取css成单独文件 // 用来拼接绝对路径的方法 const {resolve} = require('path') const HtmlWebpackPlugin = requir ...

  10. pyinstaller设置图标出现“struct.error: unpack requires a buffer of 16 bytes”

    pyinstaller设置图标出现"struct.error: unpack requires a buffer of 16 bytes" 直接用png图片改后缀名为ico,然后p ...