Design based on biology 通过比较基因组学的方法,将脊椎动物基因组的数据,解决生物学各方面问题.新的调控注释(在脊椎动物的进化过程中的出现的)可以丰富物种树(比如不同功能蛋白质进化速度上的差异(因为编码蛋白质基因和早期进化基因的发现)). Sequencing 需要以下两种策略叠加: 1.Pooled genome sequence strategies :测同一物种的不同个体,不同个体叠加. 2.representative genome assembly approac…
sequencing:使用二代测序原因:高通量,短序列 不用长序列原因: 1.算法错误率高 2.长序列测序将嵌合体基因错误积累.嵌合体基因:通过重组由来源与功能不同的基因序列剪接而形成的杂合基因 sequencing: 增多的total length>N>gap>missing in genome The reads with a frequency > 1 were called duplicated reads, and we defined the duplication r…
转自:http://dskernel.blogspot.com/2012/04/8-reviews-about-de-novo-genome-assembly.html 8 reviews about de novo genome assembly   1.   Monya Baker (Editor at Nature) De novo genome assembly: what every biologist should know Nature Methods 9, 333–337 (20…
转载:http://blog.sina.com.cn/s/blog_4af3f0d20100fq5i.html 短序列组装(Sequence assembly)几乎是近年来next-generation sequencing最热门的话题.简单来说,就是把基因组长长的序列打断(shotgun sequencing),因为我们不知道基因组整条序列是如何排列(成一条链,最后成为一条染色体)组合(如何区分不同染色体)的,而我们又无法实现一次 把整条长序列完整测序(现在有单子测序可能是一个新的sunlig…
打开UCSC Genome Browser官网.网址:http://genome.ucsc.edu/ 点击导航栏的Genome Data 在新的页面中,点击human,可快速定位至页面中人类基因组数据所在位置. 点击Genome sequence files and select annotations (2bit, GTF, GC-content, etc)后继续点击Standard genome sequence files and select annotations (2bit, GTF…
鲤鱼基因组:http://www.ntv.cn/a/20140923/52953.shtml   关于鲤鱼基因组的测定,数据质量控制遭到质疑. Why you should QC your reads AND your assembly?   Graham Etherington http://grahametherington.blogspot.co.uk/2014/09/why-you-should-qc-your-reads-and-your.html The genome sequenc…
注:从进入生信领域到现在,已经过去快8年了.生物信息学包含了我最喜欢的三门学科:生物学.计算机科学和数学.但是如果突然问起,什么是生物信息学,我还是无法给出一个让自己满意的答案.于是便有了这篇博客. 起源 据说在1970年,荷兰科学家Paulien Hogeweg和Ben Hesper最早在荷兰语中创造了"bioinformatica"一词,英语中的"bioinformatics" 在1978年首次被使用.这两位科学家当时使用该词来表示: The study of…
http://blog.sciencenet.cn/blog-1469385-819498.html 文章目录 一.准备工作 二.流程概览 三.流程 首先说说GATK可以做什么.它主要用于从sequencing 数据中进行variant calling,包括SNP.INDEL.比如现在风行的exome sequencing找variant,一般通过BWA+GATK的pipeline进行数据分析. 要run GATK,首先得了解它的网站(http://www.broadinstitute.org/…
GWAS Catalog The NHGRI-EBI Catalog of published genome-wide association studies EBI负责维护的一个收集已发表的GWAS研究的数据库 Catalog stats Last data release on 2019-09-24 4220 publications 107486 SNPs 157336 associations Genome assembly GRCh38.p12 dbSNP Build 151 Ense…
1. For the Impatient # Download bwakit (or from <http://sourceforge.net/projects/bio-bwa/files/bwakit/> manually) wget -O- http://sourceforge.net/projects/bio-bwa/files/bwakit/bwakit-0.7.15_x64-linux.tar.bz2/download \ | gzip -dc | tar xf - # Genera…