求Read Depth
如何划窗统计测序数据的reads数(depth):https://blog.csdn.net/shenshenwu666/article/details/80936374
方法1,用samtools depth。但是这个方法仅仅局限于对单个位点进行depth进行统计
samtools depth -b bed_file sample.bam > sample.depth
bed 用来指定统计区间,运行后输出指定区间每一个碱基的测序深度(由于涉及所有碱基,因此文件很大)
方法2,用samtools bedcov方法。
samtools bedcov bed_file samplename.bam > sample.bedcov
输出的文件中计算了bed文件每一个区间的碱基总数,这里并不是reads的条数
方法3,bedtools软件。。需要使用滑动窗口来对区间进行统计,这样可以观察在整条染色体上测序深度的变化趋势:
1). bedtools makewindows -g genome.txt -w 10000000 -s 1000000 > windows.bed
#bedtools makewindows用来自动生成划窗区间。-g genome.txt是要划分的基因组,格式为两列:染色体、染色体长度;-w 10000000为窗口大小为10M;-s 1000000为步长为1M,即窗口在染色体上每次向右平移1M的距离;windows.bed为输出文件,格式为三列:染色体、区间开始位点、区间结束位点。
2). bedtools coverage -a windows.bed -b xxx.sort.bam > xxx.depth.txt
#bedtools coverage对划分好的每个滑动窗口进行reads数(depth)的统计。-a windows为上一步划分好的区间;-b xxx.sort.bam为测序数据mapping到参考基因组的比对文件;xxx.depth.txt为统计结果的输出文件,格式为7列:染色体、区间起始位点、区间结束位点、该区间内的reads数、该区间内的碱基数、区间大小、该区间的平均覆盖度。
#关于xxx.sort.bam文件的几点说明:
1. 一般将测序数据mapping到参考基因组之后的输出文件为sam文件格式,需要先用samtools view -bS xxx.sam > xxx.bam转换为bam格式
2.xxx.bam还需要进行排序和建立索引才能用于后续的统计:
samtools sort xxx.bam xxx.sort ##输出结果为xxx.sort.bam
samtools index xxx.sort.bam ##输出结果为xxx.sort.bam.bai
---------------------
作者:wu伸伸
来源:CSDN
原文:https://blog.csdn.net/shenshenwu666/article/details/80936374
方法4,https://www.jianshu.com/p/82ed6e27f571
方法5, GATK软件
java -Xmx30g -XX:ParallelGCThreads=6 -jar /opt/GenomeAnalysisTK.jar -T DepthOfCoverage -R /path/genome.fna -I /path/sample.bam -o /path/sample.DepthOfCoverage -nt 10 -ct 5 -ct 1 -ct 10 -ct 30 -ct 50 --omitDepthOutputAtEachBase --omitIntervalStatistics --omitLocusTable
使用DepthOfCoverage模块统计测序深度和覆盖度。与samtools depth 一样,统计每个碱基的测序深度。 -ct指定统计测序深度的阈值,如 -ct 1 统计测序深度为1 的碱基占比。
https://mp.weixin.qq.com/s/7KiXyvKgQ35wHfEiDLvLyQ
GCdepth散点图绘制:
https://blog.csdn.net/huangliangbo0805/article/details/51165943?utm_source=blogxgwz2
滑窗口统计基因组GC含量的分布:
https://blog.csdn.net/hugolee123/article/details/38441927?utm_source=blogxgwz1
求Read Depth的更多相关文章
- POJ 1330 Nearest Common Ancestors / UVALive 2525 Nearest Common Ancestors (最近公共祖先LCA)
POJ 1330 Nearest Common Ancestors / UVALive 2525 Nearest Common Ancestors (最近公共祖先LCA) Description A ...
- 【BZOJ4573】[ZJOI2016] 大森林(LCT)
点此看题面 大致题意: 有\(n\)棵树,初始各有\(1\)个编号为\(1\)的节点,且其为生长节点.\(3\)种操作:将\([l,r]\)区间内的树增加一个新的编号的节点,修改\([l,r]\)区间 ...
- 【LNOI 2014】 LCA
[题目链接] 点击打开链接 [算法] 考虑求lca(x,y)的深度 我们可以将从根到x路径上的点都打上标记,然后,询问y到根上路径的权值和 那么,求sigma(depth(lca(i,z)))(l & ...
- 线段树&数链剖分
傻逼线段树,傻逼数剖 线段树 定义: 线段树是一种二叉搜索树,与区间树相似,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个叶结点. 使用线段树可以快速的查找某一个节点在若干条线段中出现 ...
- 瘋子C++笔记
瘋耔C++笔记 欢迎关注瘋耔新浪微博:http://weibo.com/cpjphone 参考:C++程序设计(谭浩强) 参考:http://c.biancheng.net/cpp/biancheng ...
- 【easy】104. Maximum Depth of Binary Tree 求二叉树的最大深度
求二叉树的最大深度 /** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; ...
- LeetCode Maximum Depth of Binary Tree (求树的深度)
题意:给一棵二叉树,求其深度. 思路:递归比较简洁,先求左子树深度,再求右子树深度,比较其结果,返回:max_one+1. /** * Definition for a binary tree nod ...
- leetcode 104 Maximum Depth of Binary Tree二叉树求深度
Maximum Depth of Binary Tree Total Accepted: 63668 Total Submissions: 141121 My Submissions Question ...
- 【easy】111. Minimum Depth of Binary Tree求二叉树的最小深度
求二叉树的最小深度: /** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; ...
随机推荐
- linux 目录操作命令 mkdir、rmdir、cd -、cp、scp、mv、rm
mkdir /bin/mkdir-p [目录名] 递归创建 mkdir /tmp/testmkdir /tmp/noexit/test在一个不存在的目录下创建一个目录test,要使用-p选项 可以创建 ...
- linux之redis
配置环境变量的命令: 修改环境变量: vim /root/.bash_profile 添加以下配置: export PATH=/server/tools/redis/src:$PATH 激活环境变量 ...
- solr学习笔记
目录 前言 linux部署 使用 配置 使用 前言 solr是apach基于Lucene开发的成熟的框架,这里我们学习如何部署.使用.关于集群会在后面继续添加 linux部署 mkdir /usr/l ...
- Aheadof Time Compilation(AOT) vs (JIT)Just In Time compilation approach
像java这样的高级语言,往往先做好部分编译,在运行时,再使用JIT将前面编译的中间件输出编译为机器语言,放到机器上运行.这可能会影响到运行的性能. 再比如,像angular的web 应用,angul ...
- win10下vs2015配置Opencv3.1.0过程详解(转)
下载安装Opencv3.1.0 下载Opencv3.1.0,进入官网,点击opencv for windows即可下载. 点击运行下载好的文件.实际上,opencv的安装程序就是解压缩文件,个人因为 ...
- Jmeter入门--性能测试实战
测试需求:测试20个用户访问https://www.baidu.com在负载达到30QPS时的平均响应时间. QPS:QueryperSecond,每秒查询率.一台查询服务器每秒能够处理的查询次数.在 ...
- .net 下使用Quartz.Net
Quartz.net是作业调度框架 1. 项目中添加quartz.net的引用(这里使用nuget管理) 新建一个类TimingJob,该类主要用于实现任务逻辑 using Quartz; using ...
- 山寨Facebook的Shimmer效果
山寨Facebook的Shimmer效果 说明 主要是用到了CAGradientLayer的特性来实现特效效果,因为时间有限,并没有进行封装,待后续改进. 效果 源码(源码没有进行封装,细节都没有处理 ...
- Swift-EasingAnimation
Swift-EasingAnimation 效果 http://gizma.com/easing/ 源码 https://github.com/YouXianMing/UI-Component-Col ...
- python2.7与3.5共存windows平台安装
文:铁乐与猫 2018-3-18 周日 01.首先是安装python2.7: 官网下载 https://www.python.org 点击安装包进行安装 可以选择自定义的路径 将默认打x的[add p ...