总是跑数据,却对数据一无所知,这说不过去吧. 看几篇文章吧 Sequencing depth and coverage: key considerations in genomic analyses(只讲二代) Assembly of large genomes using second-generation sequencing(参考文献) Identification of optimum sequencing depth especially for de novo genome asse…
单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向.在这一领域中,最前沿的则是单细胞测序技术.传统测序方法一次处理成千上万个细胞,得到的变异水平也是成千上万个细胞的平均后水平.但是,就如同世界上没有完全相同的两片树叶一样,没有两个细胞是完全相同的.所以,单细胞测序对于研究单个细胞就显得至关重要. 单细胞测序可以揭示出每个细胞独特的微妙变化,甚至可以…
最近接触的数据都是靶向测序,或者全外测序的数据.对数据的覆盖深度及靶向捕获效率的评估成为了数据质量监控中必不可少的一环. 以前都是用samtools depth 算出单碱基的深度后,用perl来进行深度及捕获效率的计算.今天无意中看到了bamdst(https://github.com/shiquan/bamdst)这个软件,用起来也很方便,参考GitHub,在此记录使用方法. 下载并安装:下载安装包并解压后, cd ./bamdst-master make 安装好后,需要准备.bed文件及.b…
如何划窗统计测序数据的reads数(depth):https://blog.csdn.net/shenshenwu666/article/details/80936374 方法1,用samtools depth.但是这个方法仅仅局限于对单个位点进行depth进行统计 samtools depth -b bed_file sample.bam > sample.depth bed 用来指定统计区间,运行后输出指定区间每一个碱基的测序深度(由于涉及所有碱基,因此文件很大) 方法2,用samtools…
参考: Lander-Waterman Model 这个模型是鸟枪法测序和基因组装的最基本的理论模型,它揭示了测序深度与覆盖度之间的关系. 该模型回答了一个最基本的问题:How many reads to we need to be sure we cover the whole genome? Genome Sequencing - PPT Chapter 5.1. Lander-Waterman Statistics for Shotgun Sequencing 这个模型是用来做基因组装的.…
(组装方面):SOAPdenovo ,因为采用de Bruijn graph algorithm算法和stepwise strategy ,所以排错能力高,所以我们获得高质量数据. de Bruijn graph algorithm算法???? reads到contig :多个reads比对,比对后reads之间有重叠(overlap)区,拼接获得的序列称为Contig. contig到scaffold:把mate-pair得到的用于确立位置的短reads和insert组合,将原本孤立的cont…
全基因组测序 Whole Genome Sequencing 全基因组测序(Whole Genome Sequencing,WGS)是利用高通量测序平台对一种生物的基因组中的全部基因进行测序,测定其 DNA 的碱基序列.利用该技术可在全基因组水平上检测单核苷酸变异 (SNV).插入缺失 (InDel).拷贝数变异 (CNV) 和结构变异 (SV) 等多种全面的突变信息. 研究应用 全基因测序广泛应用于临床医药研究.群体遗传学研究.关联分析.进化分析.变异检测.遗传图谱构建.功能基因挖掘和群体进化…
写在前面 上一节我们使用AssImp载入了3d模型,效果已经令人激动了.可是绘制效率和场景真实感还存在不足,接下来我们还是要保持耐心,继续学习一些高级主题,等学完后面的高级主题,我们再次来改进我们载入模型的过程. 本节将会学习深度測试.文中演示样例程序源码均能够在我的github下载. 本节内容整理自 1.www.learnopengl.com Depth testing 2.depth buffer faq 3.Z buffer 和 W buffer 簡介 通过本节能够了解到 为什么须要深度缓…
Genome Coverage and the OR Subgenome 因为: 爬行类动物的的gene numbers比较大,而birds 的 gene numbers 处于(182-688) 其中: (1)gene 扩张和缩小(之后会详细说明) (2)chicken and zebra finch (long insert sanger)were significantly larger than those in other birds(short insert NGS), 所以认为测序方…
什么是RNA-Seq (RNA Sequencing) 2011-07-14 ~ ADMIN 随着ome为词尾的各种组学的出现,转录组学已经成为了人们了解生物信息的一个重要组成部分.人们使用了许多办法来掌握转录组的情况,主要分为两类,一类是基于杂交,一类是基于下一代测序技术(Next Generation Sequencing, NGS). 基于杂交的办法,主要是依靠印刷有荧光标记探针的基因芯片来实现.比如说基因组芯片,它高密度的集成了分辨率高达几bp~100bp的探针,通过与样品杂交荧光显色的…