Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint
(Panda, dog and human repeat comparison):与其他动物比较重复序列
我们使用Repbase 库(重复序列库)+已知的转录原件序列+识别软件,评估出转录原件占比,并且与狗和人相比。用Repbase数据库(扩张度来自repeat base)分析熊猫基因中的转录原件的扩张度,得到:大部分熊猫转录原件基因有超过10% 的共有序列的扩张度(这是因为repbase数据库数据基于哺乳动物基因,并没有大熊猫基因)。小部分低于10%的扩张度(这可能是哺乳动物最近起源的活性转座子)。
Repbase library:database mask and annotation repetitive DNA
RepeatModeller:de-novo repeat family identification and modeling package
(Panda genome has a low divergence rate):
(investigate the rate of recent segmental duplication):采用self-sequence alignment,先在全基因组识别出重复片段个数及其大小(因为测序reads与组装的全基因组相比较,测序readsmapping上的重复片段多,所以在assembly过程中丢失了一些重复片段,同时因为这些片段的reads深度明显高于其他区域,所以要与depth相乘),所以根据平均depth(重复片段的average depth)和测序reads大小,得到重复片段的大小。
self-sequence alignment:自己的基因和自己的基因相互比对得到
(investigate panda genome conservation and evolution,)比对了狗,人,熊猫的全基因组,三者有相似序列,不相似的部分:包括狗与熊猫的相似度高于(人与狗,人与熊猫),熊猫的特异性序列最少,所以熊猫基因组的扩展性是最低的。

(the panda, dog and human genomes had high genomic synteny)比人,狗,熊猫第二条染色体的35条scaffold,没发现大规模重排。conserved synteny+pairwise syntenic regions
conserved synteny:保守同源区;pairwise syntenic regions:成对同源区
(genomic rearrangement events)重排事件,用几乎全基因组的scaffold序列,比较狗和熊猫的染色体间较小同源片段,片段有大有小(之前打断成不同大小的小序列),使用人类基因作为参照,发现dog中重排是panda的三倍,所以表明panda的扩张度较低。
Cutoff:截取片段
Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint的更多相关文章
- Multiple sequence alignment Benchmark Data set
Multiple sequence alignment Benchmark Data set 1. 汇总: 序列比对标准数据集: http://www.drive5.com/bench/ This i ...
- [Sequence Alignment Methods] Dynamic time warping (DTW)
本系列介绍几种序列对齐方法,包括Dynamic time warping (DTW),Smith–Waterman algorithm,Cross-recurrence plot Dynamic ti ...
- [Sequence Alignment Methods] Cross-Recurrent Plot (CRP)
A recurrence plot (RP) is a straightforward way to visualize characteristics of similar system state ...
- [Sequence Alignment Methods] Smith–Waterman algorithm
Smith–Waterman algorithm 首先需要澄清一个事实,Smith–Waterman algorithm是求两个序列的最佳subsequence匹配,与之对应的算法但是求两个序列整体匹 ...
- The sequence and de novo assembly of the giant panda genome.ppt
sequencing:使用二代测序原因:高通量,短序列 不用长序列原因: 1.算法错误率高 2.长序列测序将嵌合体基因错误积累.嵌合体基因:通过重组由来源与功能不同的基因序列剪接而形成的杂合基因 se ...
- 使用IDENTITY列属性和Sequence对象
使用IDENTITY列属性 1. 建立表 Sales.MyOrders USE TSQL2012; IF OBJECT_ID(N'Sales.MyOrders', N'U') IS NOT NULL ...
- 下载并安装Prism5.0库 Download and Setup Prism Library 5.0 for WPF(英汉对照版)
Learn what’s included in Prism 5.0 including the documentation, WPF code samples, and libraries. Add ...
- GATK-BWA-MEM handle GRCh38 alternate contig mappings
1. For the Impatient # Download bwakit (or from <http://sourceforge.net/projects/bio-bwa/files/bw ...
- SAMTOOLS使用 SAM BAM文件处理
[怪毛匠子 整理] samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS m ...
随机推荐
- HDU5113【DFS+剪枝】
题意: n*m的矩阵 k种颜色 每种颜色有c[i]个 上下左右相邻的格子不能一样的颜色 问你有没有一种染色方法,有的话输出方案. 思路: 暴搜啊,n,m都才5,做完以后大哥的剪枝是奇偶剪枝,其实画完图 ...
- [Xcode 实际操作]三、视图控制器-(1)使用UIScrollView展示多个视图可控制器
目录:[Swift]Xcode实际操作 本文将演示使用滚动视图创建多个页面. [Create a new Xcode project]->[Single View App]->[Next] ...
- CF1138D.Camp Schedule
传送门 虽然是D,但是还是Sb题,把模式串跑一遍KMP,然后把按顺序放,每次放完之后跳到对应的前缀,继续放. 如果最后1的数量还有剩,再将最后的位数全部放1 代码: #include<cstdi ...
- 黑马函数式接口学习 Stream流 函数式接口 Lambda表达式 方法引用
- foreach循环报NPE空指针异常
前言 最近debug时忽然发现,如果一个集合赋值为null,那么对该集合进行foreach循环(也叫增强for循环)时,会报NPE(即空指针异常NullPointerException). 代码如下: ...
- SpringBoot | idea新建项目
1.new ----> Spring Initializr 2.设置相应文件名 3.选择需要配置
- VLAN-6-VLAN Trunk协议(VTP)
VTP能够将VLAN配置信息通告给邻居交换机,这样做可以使工程师只在一台交换机上配置VLAN,同一个VTP域中的所有其他交换机动态学习这些VLAN信息.VTP通告VLAN ID.VLAN 名称和 VL ...
- [题解](tarjan割点/点双)luogu_P3225_矿场搭建
首先和割点有关,求割点,然后这些割点应该把这个图分成了多个点双,可以考虑点双的缩点,假如缩点做的话我们要分析每个点双的性质和贡献 先拿出一个点双来,如果它没有连接着割点,那么至少要建两个,以防止其中一 ...
- JQuery数组遍历 - $.each(),$().each()和forEach()
- EasyUI datagrid 列宽度拖动问题
问题:拖不动或者偶尔能拖动,拖动不按指定? 原因:列宽度绑定的时候使用的百分比; 方法:获取总宽度,经过百分比计算在绑定