统计map上的read数量
samtools flagstat /SRA111111/SRR111222/accepted_hits.bam
78406056 + 0 in total (QC-passed reads + QC-failed reads) (1)
0 + 0 duplicates
78406056 + 0 mapped (100.00%:-nan%) (2)
78406056 + 0 paired in sequencing (3)
39915264 + 0 read1 (4)
38490792 + 0 read2 (5)
68310778 + 0 properly paired (87.12%:-nan%) (6)
73600312 + 0 with itself and mate mapped (7)
4805744 + 0 singletons (6.13%:-nan%) (8)
1208374 + 0 with mate mapped to a different chr (9)
115100 + 0 with mate mapped to a different chr (mapQ>=5) (10)
(2)=(7)+(8)
(3)=(4)+(5)
Usage: samtools flagstat <in.bam> $ samtools flagstat example.bam
+ in total (QC-passed reads + QC-failed reads) #总共的reads数
+ duplicates
+ mapped (63.09%:-nan%) #总体上reads的匹配率
+ paired in sequencing #有多少reads是属于paired reads
+ read1 #reads1中的reads数
+ read2 #reads2中的reads数
+ properly paired (53.68%:-nan%) #完美匹配的reads数:比对到同一条参考序列,并且两条reads之间的距离符合设置的阈值
+ with itself and mate mapped #paired reads中两条都比对到参考序列上的reads数
+ singletons (5.33%:-nan%) #单独一条匹配到参考序列上的reads数,和上一个相加,则是总的匹配上的reads数。
+ with mate mapped to a different chr #paired reads中两条分别比对到两条不同的参考序列的reads数
+ with mate mapped to a different chr (mapQ>=) #同上一个,只是其中比对质量>=5的reads的数量
samtools view ./accepted_hits.bam | cut -f1 | sort | uniq | wc -l
REF:
https://www.biostars.org/p/84396/
https://www.biostars.org/p/12475/
http://seqanswers.com/forums/showthread.php?t=16500
http://sourceforge.net/p/samtools/mailman/message/31201762/
http://xushengwang.blogspot.com/2010/09/interpreting-samtools-flagstat-output.html
http://genomespot.blogspot.com/2014/09/data-analysis-step-3-align-paired-end.html
http://seqanswers.com/forums/showthread.php?t=19844
统计map上的read数量的更多相关文章
- 统计tophat map上的read数量
samtools flagstat /SRA111111/SRR111222/accepted_hits.bam 78406056 + 0 in total (QC-passed reads + QC ...
- hadoop中map和reduce的数量设置
hadoop中map和reduce的数量设置,有以下几种方式来设置 一.mapred-default.xml 这个文件包含主要的你的站点定制的Hadoop.尽管文件名以mapred开头,通过它可以控制 ...
- java基础 File与递归练习 使用文件过滤器筛选将指定文件夹下的小于200K的小文件获取并打印按层次打印(包括所有子文件夹的文件) 多层文件夹情况统计文件和文件夹的数量 统计已知类型的数量 未知类型的数量
package com.swift.kuozhan; import java.io.File; import java.io.FileFilter; /*使用文件过滤器筛选将指定文件夹下的小于200K ...
- hadoop中map和reduce的数量设置问题
转载http://my.oschina.net/Chanthon/blog/150500 map和reduce是hadoop的核心功能,hadoop正是通过多个map和reduce的并行运行来实现任务 ...
- python-itchat 统计微信群、好友数量的实例
今天小编就为大家分享一篇python-itchat 统计微信群.好友数量,及原始消息数据的实例,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 效果: 好友: # 获取自己的用 ...
- python collections 里面的Counter 统计所有出现的字符数量
from collections import Counter c_num = Counter('Hello world') # 统计出现的每个字符数量print(c_num) for key, va ...
- SWFUpload 已上传成功数量控制 插件(用于解决队列满问题)
当我们在使用 SWFUpload 做文件上传时,我们需要把已经上传的文件列表做一个删除, 但在我们把已上传列表删除后,再重新上传时,会发现提示 上传队列满 的问题,原因就是有一个状态对象中的一个 成功 ...
- 通过ngx-lua来统计Nginx上的虚拟主机性能数据
Web server调研分析 Filed under: Web Server — cmpan @ 2012-10-29 20:38:34 摘要 简单可依赖的架构首先需要有一个简单可依赖的前端WebSe ...
- 分组统计并计算每组数量sql
有 字段A 和B比如数据如下A B1 21 31 4 2 22 3 统计出的sql结果: A count 1 3 2 2 select a,count(b) from t gr ...
随机推荐
- DataGridView 些许事件测试
原始设计需求:当单元格内容是空白时,鼠标进入之后,显示一些数据 直观的第一感觉必然是用CellClick,细想,如果用户不用鼠标,直接按Tab键切换单元格呢?又或者,用户直接双击涅~ 主要测试的是: ...
- Date() 及其 如何验证用户输入的日期是合法的
1.var someDate = new Date(Date.parse("May 25, 2004")); <=> var someDate = new Dat ...
- java总结第四次//常用类
六.常用类 主要内容:Object类.String类.Date类.封装类 (一)Object类 1.Object类是所有Java类的根父类 2.如果在类的声明中未使用extends关键字指明其父类,则 ...
- TI BLE CC2541的通讯协议.
包类型: 01命令/02数据/03应答消息 开始标志FF/本数据包长度(注意是16进制)/校验码/包ID/包类型01: 表示是命令/01表示下面要开始传输/03字符串编号/字符串长度/结束位FEFF ...
- Linux下创建与解压tar, tar.gz和tar.bz2文件及压缩率对比 | 沉思小屋
刚 在qq群里面一位仁兄问到文件压缩的命令,平时工作中大多用解压缩命令,要是遇到压缩就现查(这不是一个好习惯),于是整理下Linux下创建与解压 zip.tar.tar.gz和tar.bz2文件及他们 ...
- maven手动安装jar到本地仓库
比如oracle驱动ojdbc5.jar 1,安装MAVEN,并配置系统环境变量 2,将jar文件复制到d: 3,打开cmd窗口,cd到d: 4,执行命令:mvn install:install-fi ...
- Windows驱动开发(中间层)
Windows驱动开发 一.前言 依据<Windows内核安全与驱动开发>及MSDN等网络质料进行学习开发. 二.初步环境 1.下载安装WDK7.1.0(WinDDK\7600.16385 ...
- php开启openssl的方法,openssl安装
php开启openssl的方法,openssl安装 2014年10月10日 8312次浏览 什么是openssl? 关于openssl,我说的不如百度百科齐全,还是看看百度百科的解释吧!http:// ...
- 《图解TCP/IP》
MAC寻址:地址转发表:IP寻址:路由控制表. 网卡(网络接口卡),NIC. 循环复用DNS技术. 代理服务器是一种应用网关.防火墙. LLC是Logical Link Control的缩写,意为:逻 ...
- java 面试每日一题7
题目:判断101-200之间有多少个素数,并输出所有素数. 1.程序分析:判断素数的方法:用一个数分别去除2到sqrt(这个数),如果能被整除, 则表明此数不是素数,反之是素数. public cla ...