SAM格式 及 比对工具之 samtools 使用方法
参考资料:
- SAMtools(官网)
- SAM Spec v1.4 (SAM格式 说明书) (重要)
- samtools-1.3.1 使用手册 (SAMtools软件说明书)
- samtools常用命令详解(博客园)
- SAM格式定义(博耘生物)
- samtools使用方法(plob)
这个学习急不来,而且比对非常重要,先把上面的官方SAM/BAM格式说明文件看透`Sequence Alignment/Map Format Specification`
SAMtools解决的问题
- 非常多序列(read),mapping到多个参考基因组(reference)上;
- 同一条序列,分多段(segment)比对到参考基因组上;
- 无限量的,结构化信息表示,包括错配、删除、插入等比对信息;
samtools 格式详解
@SQ SN:Supercontig_6 LN:4218384
SRR1216519.3960650 73 Supercontig_6 5 0 67M13S = 5 0 CTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCCAACCCCAACCCCACACCCCACACC EEEEED?CEEFFDFFFDBFEEEDEAB=EBC@-?@?BE=EB?-B?#################################### NM:i:2 AS:i:57 XS:i:57
#R498-三代组装比对信息
@SQ SN:tig00000000 LN:110432
@SQ SN:tig00000001 LN:42601
@SQ SN:tig00000002 LN:14821
@PG ID:bwa PN:bwa VN:0.7.10-r789 CL:/public/software/bwa-0.7.10/bwa mem -e breakpoint.contigs breakpoint.contigs.fasta
tig00000000 0 tig00000002 6796 60 99995S62M1D17M2I2 * 0 0 TGAAAACACCAGTCGGTGGTCGGC * NM:i:228 MD:Z:7G16G34T2 AS:i:840 XS:i:0 SA:Z:tig00000001,41895,+,
SAM格式,即序列比对文件格式,由头部区(@开头)和 主体区组成,均以tab分列。
- 头部区:体现比对的总体信息,如SAM格式版本,参考序列,使用软件。
- 主体区:比对结果,每一列都是一个比对结果,有11个主列 和 1个可选列。
以上:
@SQ行:SN是参考序列名;LN是参考序列长度。
下一行分别是:
- QNAME(比对序列名);
- FLAG(比对类型,由2的次方的累加,如73=64+8+1);
- RNAME(比对上的参考序列名字)
- POS(比对上的序列最左边的碱基的位置)
- MAPQ(比对质量,BWA算出来的)
- CIGAR(比对结果信息,简写)
- MENM(pair序列比对在参考基因组上的名字,同上RNAME)
- MPOS(pair比对位置,同上POS)
- ISIZE(插入片段长度)
- SEQ(序列信息,来自fastQ)
- QUAL(质量信息,来自fastQ)
- 可选列(格式为TAG:TYPE:VALUE,提供额外信息)
局部组装常用命令及其参数
$samtoolsdir/samtools view -@ $NP -Sb $out/bwamem_$sample.sam -o $out/bwamem_$sample.bam
-@ 硬件参数
-S 输入为SAM文件
-b 输出为BAM文件
-o 指定输出文件
$samtoolsdir/samtools sort -@ $NP $out/bwamem_$sample.bam -o $out/bwamem_$sample.sorted.bam $samtoolsdir/samtools index $out/bwamem_$sample.sorted.bam
注意:目前使用的参数中均没有影响结果的参数
SAM格式 及 比对工具之 samtools 使用方法的更多相关文章
- 解读sam格式文件
1,SAM文件格式介绍 SAM(The Sequence Alignment / Map format)格式,即序列比对文件的格式,详细介绍文档:http://samtools.github.io/h ...
- sam格式详细说明
原文链接 https://www.jianshu.com/p/386f520e5de1 The SAM Format Specification(sam格式说明) 1 The SAM Format S ...
- BAM/SAM格式
本质上就是二进制压缩的SAM文件,大部分生物信息学流程都需要这个格式,为了节省存储空间以及方便索引. # BiocInstaller::biocLite('Rsamtools') library(Rs ...
- 可视化工具之 IGV 使用方法
整合基因组浏览器(IGV)是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据.它支持各种数据类型,包括array-based的和下一代测序的数据和基因注释. IGV这个工具很牛,发了NB: ...
- Java 使用Redis缓存工具的图文详细方法
开始在 Java 中使用 Redis 前, 我们需要确保已经安装了 redis 服务及 Java redis 驱动,且你的机器上能正常使用 Java. (1)Java的安装配置可以参考我们的 Java ...
- Java基础知识强化之集合框架笔记33:Arrays工具类中asList()方法的使用
1. Arrays工具类中asList()方法的使用 public static <T> List<T> asList(T... a): 把数组转成集合 注意事项: 虽然可以把 ...
- Linux性能分析工具与图形化方法
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~. 作者:赵坤|腾讯魔王工作室后台开发工程师 在项目开发中,经常会遇到程序启动时间过长.CPU使用率过高等问题,这个时候需要依靠性能分析工具来 ...
- Hutool工具里,POST方法,body中传参的几种调用方法
接口说明: POSTMAN测试: JAVA代码: package com.provy.guard.api; import java.util.HashMap; import java.util.Map ...
- WQL语言简介和WQL测试工具wbemtest.exe使用方法详细介绍
这篇文章主要介绍了WQL语言简介和WQL测试工具wbemtest.exe使用方法详细介绍,WQL是指Windows管理规范查询语言,需要的朋友可以参考下 WQL就是WMI中的查询语言,WQL的全称是W ...
随机推荐
- lua中特殊用法
th> a=torch.zeros(,) [.0001s] th> a [torch.DoubleTensor of size 1x5] [.0001s] th> a[{,floor ...
- shell与kernel的理解 转载
Shell 的英文释义是外壳,与 kernel 内核名词遥相呼应,一外一内,一壳一核.内核就像瑞士银行的金库,存放着客户的黄金等众多的(硬件)资产,闲杂人等(包括客户)当然是严格禁止入内的,而作为客户 ...
- office2010官方下载 免费完整版.zip
office2010官方下载 免费完整版.zip http://pan.baidu.com/share/link?shareid=1103795384&uk=67799523 ________ ...
- Python3基础 逻辑与 and
镇场诗:---大梦谁觉,水月中建博客.百千磨难,才知世事无常.---今持佛语,技术无量愿学.愿尽所学,铸一良心博客.------------------------------------------ ...
- 关于float的感悟
给元素设置了float样式后,最终的结果是: 1:这个元素漂浮起来, 2:其他的元素位置可以视为 这个元素不存在 的时候的位置:但是float样式还是对整个页面有所影响 3:float的影响就是他附近 ...
- 0(Mark)(随时添加) ubuntu的一些 终端 命令整理
MARK 1 查看cpu信息cat /proc/cpiinfo 2 查看ubuntu版本:cat /etc/issue 3 查看系统是32位还是64位方法1:#查看long的位数,返回32或64 ge ...
- linux 中的快捷键
终端快捷键 tab=补全 ctrl+a=开始位置 ctrl+e=最后位置 ctrl+k=删除此处至末尾所有内容 ctrl+u=删除此处至开始所有内容 ctrl+d=删除当前字母 ctrl+w=删除此处 ...
- OB命令大全
CALC : 判断表达式 WATCH : 添加监视表达式 AT : 在指定地址进行反汇编 FOLLOW : 跟随命令 ORIG : ...
- Metasploit中使用Nessus插件命令
基本命令 导入扫描结果 db_import /路径/文件.nessus 查看数据库里面现有的IP信息 msf > db_hosts -c address,svcs,vulns(注:vulns是 ...
- [SAP ABAP开发技术总结]采购、销售、生产简单业务流程
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...