如何划窗统计测序数据的reads数(depth):https://blog.csdn.net/shenshenwu666/article/details/80936374

方法1,用samtools depth。但是这个方法仅仅局限于对单个位点进行depth进行统计

samtools depth -b bed_file sample.bam > sample.depth

bed 用来指定统计区间,运行后输出指定区间每一个碱基的测序深度(由于涉及所有碱基,因此文件很大)

方法2,用samtools bedcov方法。

samtools bedcov bed_file samplename.bam > sample.bedcov

输出的文件中计算了bed文件每一个区间的碱基总数,这里并不是reads的条数

方法3,bedtools软件。。需要使用滑动窗口来对区间进行统计,这样可以观察在整条染色体上测序深度的变化趋势:

1). bedtools makewindows -g genome.txt -w 10000000 -s 1000000 > windows.bed

#bedtools makewindows用来自动生成划窗区间。-g genome.txt是要划分的基因组,格式为两列:染色体、染色体长度;-w 10000000为窗口大小为10M;-s 1000000为步长为1M,即窗口在染色体上每次向右平移1M的距离;windows.bed为输出文件,格式为三列:染色体、区间开始位点、区间结束位点。

2). bedtools coverage -a windows.bed -b xxx.sort.bam > xxx.depth.txt

#bedtools coverage对划分好的每个滑动窗口进行reads数(depth)的统计。-a windows为上一步划分好的区间;-b xxx.sort.bam为测序数据mapping到参考基因组的比对文件;xxx.depth.txt为统计结果的输出文件,格式为7列:染色体、区间起始位点、区间结束位点、该区间内的reads数、该区间内的碱基数、区间大小、该区间的平均覆盖度。

#关于xxx.sort.bam文件的几点说明:

1. 一般将测序数据mapping到参考基因组之后的输出文件为sam文件格式,需要先用samtools view -bS xxx.sam > xxx.bam转换为bam格式

2.xxx.bam还需要进行排序和建立索引才能用于后续的统计:

samtools sort xxx.bam xxx.sort   ##输出结果为xxx.sort.bam

samtools index xxx.sort.bam      ##输出结果为xxx.sort.bam.bai
---------------------
作者:wu伸伸
来源:CSDN
原文:https://blog.csdn.net/shenshenwu666/article/details/80936374

方法4,https://www.jianshu.com/p/82ed6e27f571

方法5, GATK软件

java -Xmx30g -XX:ParallelGCThreads=6 -jar /opt/GenomeAnalysisTK.jar -T DepthOfCoverage -R /path/genome.fna -I /path/sample.bam -o /path/sample.DepthOfCoverage -nt 10 -ct 5 -ct 1 -ct 10 -ct 30 -ct 50 --omitDepthOutputAtEachBase --omitIntervalStatistics --omitLocusTable

使用DepthOfCoverage模块统计测序深度和覆盖度。与samtools depth 一样,统计每个碱基的测序深度。 -ct指定统计测序深度的阈值,如 -ct 1 统计测序深度为1 的碱基占比。

https://mp.weixin.qq.com/s/7KiXyvKgQ35wHfEiDLvLyQ

GCdepth散点图绘制:

https://blog.csdn.net/huangliangbo0805/article/details/51165943?utm_source=blogxgwz2

滑窗口统计基因组GC含量的分布:

https://blog.csdn.net/hugolee123/article/details/38441927?utm_source=blogxgwz1

求Read Depth的更多相关文章

  1. POJ 1330 Nearest Common Ancestors / UVALive 2525 Nearest Common Ancestors (最近公共祖先LCA)

    POJ 1330 Nearest Common Ancestors / UVALive 2525 Nearest Common Ancestors (最近公共祖先LCA) Description A ...

  2. 【BZOJ4573】[ZJOI2016] 大森林(LCT)

    点此看题面 大致题意: 有\(n\)棵树,初始各有\(1\)个编号为\(1\)的节点,且其为生长节点.\(3\)种操作:将\([l,r]\)区间内的树增加一个新的编号的节点,修改\([l,r]\)区间 ...

  3. 【LNOI 2014】 LCA

    [题目链接] 点击打开链接 [算法] 考虑求lca(x,y)的深度 我们可以将从根到x路径上的点都打上标记,然后,询问y到根上路径的权值和 那么,求sigma(depth(lca(i,z)))(l & ...

  4. 线段树&数链剖分

    傻逼线段树,傻逼数剖 线段树 定义: 线段树是一种二叉搜索树,与区间树相似,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个叶结点. 使用线段树可以快速的查找某一个节点在若干条线段中出现 ...

  5. 瘋子C++笔记

    瘋耔C++笔记 欢迎关注瘋耔新浪微博:http://weibo.com/cpjphone 参考:C++程序设计(谭浩强) 参考:http://c.biancheng.net/cpp/biancheng ...

  6. 【easy】104. Maximum Depth of Binary Tree 求二叉树的最大深度

    求二叉树的最大深度 /** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; ...

  7. LeetCode Maximum Depth of Binary Tree (求树的深度)

    题意:给一棵二叉树,求其深度. 思路:递归比较简洁,先求左子树深度,再求右子树深度,比较其结果,返回:max_one+1. /** * Definition for a binary tree nod ...

  8. leetcode 104 Maximum Depth of Binary Tree二叉树求深度

    Maximum Depth of Binary Tree Total Accepted: 63668 Total Submissions: 141121 My Submissions Question ...

  9. 【easy】111. Minimum Depth of Binary Tree求二叉树的最小深度

    求二叉树的最小深度: /** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; ...

随机推荐

  1. sql 日期类型可以使用大于、小于号直接进行比较运算

    select * from emp where hiredate > '1982-1-1';  -- mysqlselect * from emp where hiredate > to_ ...

  2. Navicat Premium 连接MySQL数据库出现Authentication plugin 'caching_sha2_password' cannot be loaded的解决方案

    1. 管理员权限运行命令提示符,登陆MySQL mysql -u root -p root 2. 修改账户密码加密规则并更新用户密码  ALTER USER 'root'@'localhost' ID ...

  3. 【Python】Java程序员学习Python(六)— 流程控制、异常处理

    和Java语言一样,Python也有基本的流程控制,简单了解下即可. 一.流程控制的元素 条件 条件就是布尔值或者布尔值的表达式,要么是True要么是False. 代码块 在Python中,代码块不是 ...

  4. 前端构建工具 Gulp.js 上手实例

    在软件开发中使用自动化构建工具的好处是显而易见的.通过工具自动化运行大量单调乏味.重复性的任务,比如图像压缩.文件合并.代码压缩.单元测试等等,可以为开发者节约大量的时间,使我们能够专注于真正重要的. ...

  5. maven打包 springBoot 工程时,默认识别resources目录,习惯使用 resource 目录的需要手动指定静态资源目录

    最近项目开发,发现springBoot项目在使用maven打包时,我们静态资源文件都放在resource目录下面,大致如下: 在使用maven打包时,发现静态资源没有打进去.原来springBoot默 ...

  6. maven一键部署linux的tomcat(wagon-maven-plugin)

    Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(Project Lifecycle),一个依赖管理系统(Depen ...

  7. Linux file命令详解

    file: 查看文件类型 file常见命令参数 Usage: file [OPTION...] [FILE...] Determine type of FILEs. --help display th ...

  8. spring4声明式事务—02 xml配置方式

    1.配置普通的 controller,service ,dao 的bean. <!-- 配置 dao ,service --> <bean id="bookShopDao& ...

  9. September 06th 2017 Week 36th Wednesday

    I love you not for who you are, but for who I am with you. 我爱你并不是因为你是谁,而是我在你面前可以是谁. I love you just ...

  10. ZT 二叉树先序,中序,后序遍历非递归实现

    二叉树先序,中序,后序遍历非递归实现 分类: 数据结构及算法2012-04-28 14:30 8572人阅读 评论(6) 收藏 举报 structc 利用栈实现二叉树的先序,中序,后序遍历的非递归操作 ...