准备读四篇denovo的文献:

  1. Nature Biotechnology(2015) - Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement
  2. Whole-genome sequencing of the snub-nosed monkey provides insights into folivory and evolutionary history
  3. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars
  4. Ground tit genome reveals avian adaptation to living at high altitudes in the Tibetan plateau

1. 四倍体陆地棉基因组

allotetraploid:异源四倍体;Upland cotton:陆地棉
Structural rearrangements:结构重组;gene loss:基因缺失;disrupted genes:扰乱基因;sequence divergence:序列分歧;asymmetric evolution:不对称进化
方法:

  1. whole-genome shotgun reads:全基因组鸟枪法
  2. bacterial artificial chromosome (BAC)-end sequences:
  3. genotype-by-sequencing genetic maps:

背景:虽然已有测序,但是exact donor species that led to the formation of the tetraploid cotton species 1–2 million years ago (MYA) no longer exists。
测序难点:discriminating between homoeologous sequences(识别同源序列)
传统做法:祖先的二倍体基因组序列,来指导异源多倍体的同源染色体的装配。
问题:关于同源关系的许多contigs 和 scaffolds 保持模棱两可。
本研究的核心优势:scaffolds (N50 = 1,600 kb)长,相比与Brassica napus (N50 = 764 kb),Nicotiana tabacum(N50 = 345~386 kb),wheat (contig N50 = 515~4,297 bp),G. arboreum(N50 = 666 kb)

方法:
Genome sequencing data generation
sheared with a Bioruptor sonication device for short-insert paired-end (PE) library construction
with a Hydroshear DNA Shearing Device (Genomic Solutions Inc., Ann Arbor, MI, USA) for mate-pair library construction
Short-insert paired-end (180, 300, and 500 bp) and large-insert mate-pair libraries (2, 5, 10 kb) were prepared
All libraries were sequenced at 2 × 100 bp on an Illumina HiSeq 2000 platform. In total, 843 Gb of DNA sequencing read data were generated for the genome assembly, representing approximately 337-fold coverage of the raw genome.

BAC library construction and BAC end sequencing
read短,无法确定在基因组的位置,获得的只是contig。
BAC文库可以帮助我们拼接更长的序列。另外由于文库构建存在一定的偏好性,或者有一些序列GC含量太高或太低,当然还有一些repeat序列,所以BAC文库也可以帮助我们对这些序列更好的获得。现在主流的方法是:构建mate-pair文库+多插入片段PE文库+多测序平台结合+fish或者binano光学图谱。

Genome size estimation

Genome assembly, scaffolding and gap-closing

Linkage map construction using the TM-1 × Hai7124 mapping population

Correction of the TM-1 assembly using the SNP map and pseudomolecule chromosome construction

Assessment of genome assembly quality by PE reads

TM-1 assembly validation using mRNA sequences from the G. raimondii and G. hirsutum genomes

TM-1 assembly validation using 36 completely sequenced BACs

Gene prediction and annotation

Transcription factors annotation

Noncoding RNAs annotation

TE annotation

Identification of homoeologous gene sets and orthologous gene sets

Estimation of divergence time

Phylogenetic tree construction and evolution rate estimation

Syntenic analysis and whole-genome alignment

PSGs

Gene loss

Genes involved in the ongoing process of gene loss

2. 金丝猴基因组

3. 藏猪基因组

4. 地山雀基因组

2016-6-15-de novo文献阅读的更多相关文章

  1. Uncovering thousands of new peptides with sequence-mask-search hybrid de novo peptide sequencing framework (使用序列掩码搜索结合肽段从头测序框架发现了数千个新肽段)-解读人:刘佳维

    期刊名:Molecular & Cellular Proteomics 发表时间:(2019年12月) IF:4.828 单位: 朱拉隆功大学 费城威斯塔研究所 物种:人 技术:de novo ...

  2. De novo 测序基础知识

    名词解释 De novo:拉丁文,从头开始的意思,de nove测序则是指在不需要任何参考序列的情况下对某一物种进行基因组测序,然后将测得的序列进行拼接.组装,从而绘制该物种的全基因组序列图谱. 重测 ...

  3. DISCOVAR de novo

    海宝建议用这个拼接软件 http://www.broadinstitute.org/software/discovar/blog/?page_id=98 DISCOVAR – variant call ...

  4. (转)8 reviews about de novo genome assembly

    转自:http://dskernel.blogspot.com/2012/04/8-reviews-about-de-novo-genome-assembly.html 8 reviews about ...

  5. 文献阅读笔记——group sparsity and geometry constrained dictionary

    周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...

  6. De novo RNA-Seq Assembly Using De Bruijn Graphs

    De novo RNA-Seq Assembly Using De Bruijn Graphs  2017-06-12 09:42:47     59     0     0 在说基因组的拼接之前,可 ...

  7. 全基因组测序 从头测序(de novo sequencing) 重测序(re-sequencing)

    全基因组测序 全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序 ...

  8. MCP|ZWT|Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)

    一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性, ...

  9. 文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组

    The single-cell transcriptional landscape of mammalian organogenesis 老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想 ...

随机推荐

  1. dot函数和*的区别

    dot函数是常规的矩阵相乘 *是特殊的乘法 import numpy as np a = [[1,2,3],[4,5,6]] a = np.array(a) b = [[1,2],[4,5],[3,6 ...

  2. dubbo源码之四——dubbo服务发布

    dubbo版本:2.5.4 服务发布是服务提供方向注册中心注册服务过程,以便服务消费者从注册中心查阅并调用服务. 服务发布方在spring的配置文件中配置如下: <bean id="d ...

  3. Storm系列之三——Fault Tolerance

    本文介绍Storm容错的设计细节. 1.当一个worker进程死了会发生什么? 当worker死了,supervisor会重启它.如果它尝试开启多次失败并且不能与nimbus发送心跳,Nimbus会重 ...

  4. c++学习之:根据GetLastError()返回值获取错误信息

    VC中GetLastError()获取错误信息的使用在VC中编写应用程序时,经常需要涉及到错误处理问题.许多函数调用只用TRUE和FALSE来表明函数的运行结果.一旦出现错误,MSDN中往往会指出请用 ...

  5. 求解数组环中最大子数组和的问题(java)

    //石家庄铁道大学 信1405-1 班 唐炳辉 在上一次作业中,对于普通数组的最大子数组的求解问题的基础上,将普通的数组变成一个首尾相接的环,求这个环的最大子数组.类似的,只要改变普通数组的数组位置, ...

  6. FreeSWITCH第三方库(视频)的简单介绍(二)

    FreeSWITCH使用了大量的第三方库,本文档主要介绍视频相关库的信息: 音频相关库的信息介绍参考:http://www.cnblogs.com/yoyotl/p/5486753.html 其他相关 ...

  7. CentOS最小化安装后,增加GNOME桌面

    背景:下载CentOS 7的安装包后,在虚拟机上安装. 上来就遇到一个问题:提示需要开启intel vt-x. 这个进入BIOS,在CPU的设置中开启即可. 然后怀着兴奋的心情,开始各种下一步的安装, ...

  8. 粒子群优化算法(Particle Swarm Optimization)

    粒子群算法的思想源于对鸟/鱼群捕食行为的研究,模拟鸟集群飞行觅食的行为,鸟之间通过集体的协作使群体达到最优目的,是一种基于Swarm Intelligence的优化方法.它没有遗传算法的"交 ...

  9. [SAP ABAP开发技术总结]数据输入输出转换、小数位/单位/货币格式化

    声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...

  10. APP前端公共测试点