Panda, dog and human repeat comparison):与其他动物比较重复序列

我们使用Repbase 库(重复序列库)+已知的转录原件序列+识别软件,评估出转录原件占比,并且与狗和人相比。用Repbase数据库(扩张度来自repeat base)分析熊猫基因中的转录原件的扩张度,得到:大部分熊猫转录原件基因有超过10% 的共有序列的扩张度(这是因为repbase数据库数据基于哺乳动物基因,并没有大熊猫基因)。小部分低于10%的扩张度(这可能是哺乳动物最近起源的活性转座子)。

Repbase library:database mask and annotation repetitive DNA

RepeatModeller:de-novo repeat family identification and modeling package

Panda genome has a low divergence rate):

investigate the rate of recent segmental duplication:采用self-sequence alignment先在全基因组识别出重复片段个数及其大小(因为测序reads与组装的全基因组相比较,测序readsmapping上的重复片段多,所以在assembly过程中丢失了一些重复片段,同时因为这些片段的reads深度明显高于其他区域,所以要与depth相乘),所以根据平均depth(重复片段的average depth)和测序reads大小,得到重复片段的大小。

self-sequence alignment:自己的基因和自己的基因相互比对得到

(investigate panda genome conservation and evolution,)比对了狗,人,熊猫的全基因组,三者有相似序列,不相似的部分:包括狗与熊猫的相似度高于(人与狗,人与熊猫),熊猫的特异性序列最少,所以熊猫基因组的扩展性是最低的。

 

 

the panda, dog and human genomes had high genomic synteny)比人,狗,熊猫第二条染色体的35条scaffold,没发现大规模重排。conserved synteny+pairwise syntenic regions

conserved synteny:保守同源区;pairwise syntenic regions:成对同源区

genomic rearrangement events重排事件,用几乎全基因组的scaffold序列,比较狗和熊猫的染色体间较小同源片段,片段有大有小(之前打断成不同大小的小序列),使用人类基因作为参照,发现dog中重排是panda的三倍,所以表明panda的扩张度较低。

Cutoff:截取片段

Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint的更多相关文章

  1. Multiple sequence alignment Benchmark Data set

    Multiple sequence alignment Benchmark Data set 1. 汇总: 序列比对标准数据集: http://www.drive5.com/bench/ This i ...

  2. [Sequence Alignment Methods] Dynamic time warping (DTW)

    本系列介绍几种序列对齐方法,包括Dynamic time warping (DTW),Smith–Waterman algorithm,Cross-recurrence plot Dynamic ti ...

  3. [Sequence Alignment Methods] Cross-Recurrent Plot (CRP)

    A recurrence plot (RP) is a straightforward way to visualize characteristics of similar system state ...

  4. [Sequence Alignment Methods] Smith–Waterman algorithm

    Smith–Waterman algorithm 首先需要澄清一个事实,Smith–Waterman algorithm是求两个序列的最佳subsequence匹配,与之对应的算法但是求两个序列整体匹 ...

  5. The sequence and de novo assembly of the giant panda genome.ppt

    sequencing:使用二代测序原因:高通量,短序列 不用长序列原因: 1.算法错误率高 2.长序列测序将嵌合体基因错误积累.嵌合体基因:通过重组由来源与功能不同的基因序列剪接而形成的杂合基因 se ...

  6. 使用IDENTITY列属性和Sequence对象

    使用IDENTITY列属性 1. 建立表 Sales.MyOrders USE TSQL2012; IF OBJECT_ID(N'Sales.MyOrders', N'U') IS NOT NULL ...

  7. 下载并安装Prism5.0库 Download and Setup Prism Library 5.0 for WPF(英汉对照版)

    Learn what’s included in Prism 5.0 including the documentation, WPF code samples, and libraries. Add ...

  8. GATK-BWA-MEM handle GRCh38 alternate contig mappings

    1. For the Impatient # Download bwakit (or from <http://sourceforge.net/projects/bio-bwa/files/bw ...

  9. SAMTOOLS使用 SAM BAM文件处理

    [怪毛匠子 整理] samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS m ...

随机推荐

  1. HDU5113【DFS+剪枝】

    题意: n*m的矩阵 k种颜色 每种颜色有c[i]个 上下左右相邻的格子不能一样的颜色 问你有没有一种染色方法,有的话输出方案. 思路: 暴搜啊,n,m都才5,做完以后大哥的剪枝是奇偶剪枝,其实画完图 ...

  2. [Xcode 实际操作]三、视图控制器-(1)使用UIScrollView展示多个视图可控制器

    目录:[Swift]Xcode实际操作 本文将演示使用滚动视图创建多个页面. [Create a new Xcode project]->[Single View App]->[Next] ...

  3. CF1138D.Camp Schedule

    传送门 虽然是D,但是还是Sb题,把模式串跑一遍KMP,然后把按顺序放,每次放完之后跳到对应的前缀,继续放. 如果最后1的数量还有剩,再将最后的位数全部放1 代码: #include<cstdi ...

  4. 黑马函数式接口学习 Stream流 函数式接口 Lambda表达式 方法引用

  5. foreach循环报NPE空指针异常

    前言 最近debug时忽然发现,如果一个集合赋值为null,那么对该集合进行foreach循环(也叫增强for循环)时,会报NPE(即空指针异常NullPointerException). 代码如下: ...

  6. SpringBoot | idea新建项目

    1.new ----> Spring Initializr 2.设置相应文件名 3.选择需要配置

  7. VLAN-6-VLAN Trunk协议(VTP)

    VTP能够将VLAN配置信息通告给邻居交换机,这样做可以使工程师只在一台交换机上配置VLAN,同一个VTP域中的所有其他交换机动态学习这些VLAN信息.VTP通告VLAN ID.VLAN 名称和 VL ...

  8. [题解](tarjan割点/点双)luogu_P3225_矿场搭建

    首先和割点有关,求割点,然后这些割点应该把这个图分成了多个点双,可以考虑点双的缩点,假如缩点做的话我们要分析每个点双的性质和贡献 先拿出一个点双来,如果它没有连接着割点,那么至少要建两个,以防止其中一 ...

  9. JQuery数组遍历 - $.each(),$().each()和forEach()

  10. EasyUI datagrid 列宽度拖动问题

    问题:拖不动或者偶尔能拖动,拖动不按指定? 原因:列宽度绑定的时候使用的百分比; 方法:获取总宽度,经过百分比计算在绑定