基因组共线性分析工具MCScanX
软件简介
MCScanX工具集对MCScan算法进行了调整,用于检测共线性和同线性区域,还增加了可视化和下游分析。。MCscanX有三个核心工具,以及12个下游分析工具。
软件安装
进入官网http://chibba.pgml.uga.edu/mcscan2/#tm,下载安装
1 unzip MCscanX.zip
2 cd MCScanX
3 make
软件使用
所需要文件
两个或多个物种的gff文件,蛋白序列(** 该软件最多能做5个物种的共线性)
第一步:构建索引,进行blastp比对
1 ## 合并
2 cat at.fa vv.fa >>all.fa
3
4 ## 建库
5 makeblastdb -in all.fa -dbtype prot -out index/all -parse_seqids
6
7 ## 比对
8 blastp -query all.fa -db index/all -out all.blast -evalue 1e-5 -num_threads 10 -outfmt 6 -num_alignments 5
第二步:构建gff文件
MCscanX要求的gff文件和标准的gff文件不一样,它只有四列, 其中"sp#"的sp意味着你要用2个字母代表物种,#则表示是哪条染色体。而"gene"则要是你蛋白序列的基因名
1 sp# gene starting_position ending_position
根据物种的gff3文件利用awk 快速得到MCscanX要求的gff文件
第三步:MCScanX寻找共线性区块
1 MCScanX ./all
结果文件
输出文件分为两个:
第一个是at_rice.collinearity, 记录着共线性区块(collinear blocks), 可以选择共线性区块基因大于10以上为可信区域
第二个是一个网页格式
输出共线性基因的位置信息
1 #!/usr/bin/env python
2 # _*_ coding: utf-8 _*_
3
4 import sys,re
5
6 gene_info = {}
7 syn_info = {}
8
9 IN = sys.argv[1] ##*.gff
10 IN1 = sys.argv[2] ## *.collinearity
11 IN2 = sys.argv[3] ## number,int;
12
13 with open(IN) as f,\
14 open(IN1) as f1,\
15 open("%s_syn_region_info" %IN.strip(".gff"),"w") as o:
16 for i in f:
17 i=i.strip().split()
18 gene_info[i[1]] = [i[0],i[2],i[3]]
19 for x in f1:
20 if '## Alignment' in x:
21 res=x.strip()
22 if res not in syn_info:
23 syn_info[res] = []
24 elif '#' not in x:
25 x=x.strip().split()
26 tem = x[-3]+"&&"+x[-2]
27 syn_info[res].append(tem)
28 for k,v in syn_info.items():
29 num = re.search(r" N=(\d+) ",k).group(1)
30 if int(num) >= 10:
31 for n in v:
32 # print n
33 gene1 = n.split("&&")[0]
34 gene2 = n.split("&&")[1]
35 gene1_chr = gene_info[gene1][0]
36 gene1_start = gene_info[gene1][1]
37 gene1_end = gene_info[gene1][2]
38 gene2_chr = gene_info[gene2][0]
39 gene2_start = gene_info[gene2][1]
40 gene2_end = gene_info[gene2][2]
41 o.write("%s\t%s\t%s\t%s\t%s\t%s\t%s\t%s\n"%(gene1_chr,gene1,gene1_start,gene1_end,gene2,gene2_chr,gene2_start,gene2_end))
基因组共线性工具MCScanX使用说明
基因组共线性工具MCScanX使用说明
------END------
关注下方公众号可获得更多精彩

基因组共线性分析工具MCScanX的更多相关文章
- 史上最全 | 39个RNAseq分析工具与对比
文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the ...
- OS Tools-GO富集分析工具的使用与解读详细教程
我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍: Gene Ontology(简称G ...
- Android代码分析工具lint学习
1 lint简介 1.1 概述 lint是随Android SDK自带的一个静态代码分析工具.它用来对Android工程的源文件进行检查,找出在正确性.安全.性能.可使用性.可访问性及国际化等方面可能 ...
- 【转】gc日志分析工具
性能测试排查定位问题,分析调优过程中,会遇到要分析gc日志,人肉分析gc日志有时比较困难,相关图形化或命令行工具可以有效地帮助辅助分析. Gc日志参数 通过在tomcat启动脚本中添加相关参数生成gc ...
- Java 性能分析工具 , 第 3 部分: Java Mission Control
引言 本文为 Java 性能分析工具系列文章第三篇,这里将介绍如何使用 Java 任务控制器 Java Mission Control 深入分析 Java 应用程序的性能,为程序开发人员在使用 Jav ...
- Java 性能分析工具 , 第 2 部分:Java 内置监控工具
引言 本文为 Java 性能分析工具系列文章第二篇,第一篇:操作系统工具.在本文中将介绍如何使用 Java 内置监控工具更加深入的了解 Java 应用程序和 JVM 本身.在 JDK 中有许多内置的工 ...
- Java 性能分析工具 , 第 1 部分: 操作系统工具
引言 性能分析的前提是将应用程序内部的运行状况以及应用运行环境的状况以一种可视化的方式更加直接的展现出来,如何来达到这种可视化的展示呢?我们需要配合使用操作系统中集成的程序监控工具和 Java 中内置 ...
- 系统级性能分析工具perf的介绍与使用
测试环境:Ubuntu16.04(在VMWare虚拟机使用perf top存在无法显示问题) Kernel:3.13.0-32 系统级性能优化通常包括两个阶段:性能剖析(performance pro ...
- KRPano资源分析工具使用说明(KRPano XML/JS解密 切片图批量下载 球面图还原 加密混淆JS还原美化)
软件交流群:571171251(软件免费版本在群内提供) krpano技术交流群:551278936(软件免费版本在群内提供) 最新博客地址:blog.turenlong.com 限时下载地址:htt ...
随机推荐
- vue3.x组件间通信,实用小技巧都在这里
本想简单写写,没想到说清楚已经变成了一篇很长的帖子,欢迎当笔记搜藏起来. props / emits 父子组件通信 props一般负责向子组件传递数据 下面是一个简单的例子,父组件向子组件传递了一个t ...
- Java:死锁编码及定位分析
Java:死锁编码及定位分析 本笔记是根据bilibili上 尚硅谷 的课程 Java大厂面试题第二季 而做的笔记 概念 死锁是指两个或多个以上的进程在执行过程中,因争夺资源而造成一种互相等待的现象, ...
- STM32中按键中断分析
在按键学习中,我们有用到查询的方法来判断按键事件是否发生,这种查询按键事件适用于程序工作量较少的情况下,一旦程序中工作量较大较多,则势必影响程序运行的效率,为了简化程序中控制的功能模块的执行时间,引入 ...
- 计算机网络之传输层(传输层提供的服务及功能概述、端口、套接字--Socket、无连接UDP和面向连接TCP服务)
文章转自:https://blog.csdn.net/weixin_43914604/article/details/105451022 学习课程:<2019王道考研计算机网络> 学习目的 ...
- SQL Server 插入、更新和删除数据
1.主要内容 ● 通过SSMS,插入.更新和删除表数据 ● 通过INSERT语句向表中插入数据 ● 通过UPDATE语句更新表内数据 ● 通过DELETE语句删除表内数据 ● 使用INSERT.UPD ...
- 数字设计中的时钟与约束(gate)
转载:https://www.cnblogs.com/IClearner/p/6440488.html 最近做完了synopsys的DC workshop,涉及到时钟的建模/约束,这里就来聊聊数字中的 ...
- (转载)gcc -l参数和-L参数
-l参数就是用来指定程序要链接的库,-l参数紧接着就是库名,那么库名跟真正的库文件名有什么关系呢?就拿数学库来说,他的库名是m,他的库文件名是libm.so,很容易看出,把库文件名的头lib和尾.so ...
- 恶意代码の奇客pdf分析
目录 恶意代码の奇客pdf分析 奇客PDF安装包分析 静态分析基础技术 上传杀毒网 查壳 编译时间 导入表分析 资源查看 动态分析基础技术 Process Monitor监控 Process Expl ...
- QuantumTunnel:协议路由 vs 端口路由
本篇来聊一下内网穿透中流量转发的问题 内网穿透和核心逻辑是根据流量的路由信息准确地将公网流量路由到指定的机器端口上,从而完成一次流量的内网穿透. 这里有一个核心问题,路由信息从哪里获取? 常见的有将路 ...
- VLAN技术 & ACL访问控制
VLAN介绍与配置 VLAN概述 交换网络中的问题 VLAN(Virtual Local Area Network) 在物理网络上划分出逻辑网 ,对应OS模型第二层 VLAN划分不受端口物理位置限制, ...