Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint
(Panda, dog and human repeat comparison):与其他动物比较重复序列
我们使用Repbase 库(重复序列库)+已知的转录原件序列+识别软件,评估出转录原件占比,并且与狗和人相比。用Repbase数据库(扩张度来自repeat base)分析熊猫基因中的转录原件的扩张度,得到:大部分熊猫转录原件基因有超过10% 的共有序列的扩张度(这是因为repbase数据库数据基于哺乳动物基因,并没有大熊猫基因)。小部分低于10%的扩张度(这可能是哺乳动物最近起源的活性转座子)。
Repbase library:database mask and annotation repetitive DNA
RepeatModeller:de-novo repeat family identification and modeling package
(Panda genome has a low divergence rate):
(investigate the rate of recent segmental duplication):采用self-sequence alignment,先在全基因组识别出重复片段个数及其大小(因为测序reads与组装的全基因组相比较,测序readsmapping上的重复片段多,所以在assembly过程中丢失了一些重复片段,同时因为这些片段的reads深度明显高于其他区域,所以要与depth相乘),所以根据平均depth(重复片段的average depth)和测序reads大小,得到重复片段的大小。
self-sequence alignment:自己的基因和自己的基因相互比对得到
(investigate panda genome conservation and evolution,)比对了狗,人,熊猫的全基因组,三者有相似序列,不相似的部分:包括狗与熊猫的相似度高于(人与狗,人与熊猫),熊猫的特异性序列最少,所以熊猫基因组的扩展性是最低的。

(the panda, dog and human genomes had high genomic synteny)比人,狗,熊猫第二条染色体的35条scaffold,没发现大规模重排。conserved synteny+pairwise syntenic regions
conserved synteny:保守同源区;pairwise syntenic regions:成对同源区
(genomic rearrangement events)重排事件,用几乎全基因组的scaffold序列,比较狗和熊猫的染色体间较小同源片段,片段有大有小(之前打断成不同大小的小序列),使用人类基因作为参照,发现dog中重排是panda的三倍,所以表明panda的扩张度较低。
Cutoff:截取片段
Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint的更多相关文章
- Multiple sequence alignment Benchmark Data set
Multiple sequence alignment Benchmark Data set 1. 汇总: 序列比对标准数据集: http://www.drive5.com/bench/ This i ...
- [Sequence Alignment Methods] Dynamic time warping (DTW)
本系列介绍几种序列对齐方法,包括Dynamic time warping (DTW),Smith–Waterman algorithm,Cross-recurrence plot Dynamic ti ...
- [Sequence Alignment Methods] Cross-Recurrent Plot (CRP)
A recurrence plot (RP) is a straightforward way to visualize characteristics of similar system state ...
- [Sequence Alignment Methods] Smith–Waterman algorithm
Smith–Waterman algorithm 首先需要澄清一个事实,Smith–Waterman algorithm是求两个序列的最佳subsequence匹配,与之对应的算法但是求两个序列整体匹 ...
- The sequence and de novo assembly of the giant panda genome.ppt
sequencing:使用二代测序原因:高通量,短序列 不用长序列原因: 1.算法错误率高 2.长序列测序将嵌合体基因错误积累.嵌合体基因:通过重组由来源与功能不同的基因序列剪接而形成的杂合基因 se ...
- 使用IDENTITY列属性和Sequence对象
使用IDENTITY列属性 1. 建立表 Sales.MyOrders USE TSQL2012; IF OBJECT_ID(N'Sales.MyOrders', N'U') IS NOT NULL ...
- 下载并安装Prism5.0库 Download and Setup Prism Library 5.0 for WPF(英汉对照版)
Learn what’s included in Prism 5.0 including the documentation, WPF code samples, and libraries. Add ...
- GATK-BWA-MEM handle GRCh38 alternate contig mappings
1. For the Impatient # Download bwakit (or from <http://sourceforge.net/projects/bio-bwa/files/bw ...
- SAMTOOLS使用 SAM BAM文件处理
[怪毛匠子 整理] samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS m ...
随机推荐
- 201621123016 《Java程序设计》第十三周学习总结
1. 本周学习总结 以你喜欢的方式(思维导图.OneNote或其他)归纳总结多网络相关内容. 2. 为你的系统增加网络功能(购物车.图书馆管理.斗地主等)-分组完成 为了让你的系统可以被多个用户通过网 ...
- 洛谷CF895C Square Subsets(线性基)
洛谷传送门 不知道线性基是什么东西的可以看看蒟蒻的总结 题意: 给你n个数,每个数<=70,问有多少个集合,满足集合中所有数相乘是个完全平方数(空集除外) 题解: 完全看不出这玩意儿和线性基有什 ...
- Sql Server2008R2与IDEA的连接
数据库的连接笔者搞了一天,参阅了众多连接方案,大部分都是Eclipse和My sql,笔者一遍一遍的调试,终于皇天不负有心人,成绩先摆出来 为了让更多的新手能少走弯路,话不多说,上干货 首先,我们需要 ...
- form表单提交转为ajax方式提交
<form action="xxx" method="get"> //action的值是请求的url地址 <div class="f ...
- 最短路之Dijkstra(单源)HDU 2544
#include <iostream> using namespace std; ; ][]; ]; int middist; ]; void dijkstra(int n,int m) ...
- JS面向对象方法(二) 面向对象方法实现橱窗式图面预览以及放大功能
效果图: HTML结构如下: <div id="preview"> <div id="mediumDiv"> <img id=& ...
- Java EE学习笔记(一)
spring入门程序: 1.导入Spring的4个基础包以及commons-logging的JAR包复制到lib目录中 2.src->com.itheima.ioc包下: ①UserDao.ja ...
- Jasper_crosstab_Parameter_Crosstab Header
corsstab: Q : how to show filed value at crosstab Header Part? A : via pass parameter in crosstab. i ...
- 091 Decode Ways 解码方法
包含 A-Z 的字母的消息通过以下规则编码:'A' -> 1'B' -> 2...'Z' -> 26给定一个包含数字的编码消息,请确定解码方法的总数.例如,给定消息为 "1 ...
- 使用em和rem替代px
rem是指根元素的字体大小,默认情况下html的字体大小为:16px=1rem.而em是相对单位,是基于它的祖先元素计算的. 如果我们不指定html和body的字体大小,要得到12px的rem需要这样 ...