以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。

  我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。

  我们计算了人类每个突变在种群中的连锁不平衡。

突变数据类型

Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。

外部导入的数据(dbSNP、Sanger、DGVa、…):

碱基突变(SNP、插入、缺失、…)

结构突变(拷贝数变异、串联重复、反转、…)

检测拷贝数的变化

碱基突变和结构突变的位置

等位基因

人群

基因型

表型(例如,人类中的青光眼。)

引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)

计算数据(预测数据页面

储存突变数据的物种

Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP

  Short variant Long variant Genotype Association Prediction
Species Sequence variant (e!91 → e!92) Source(s) Structural variant Sample Population Phenotype Citation SIFT PolyPhen
Cat
Felis catus
 
3.6 million+ - 1 source - - - - - -
Chicken
Gallus gallus
 
24 million+ - 1 source - -
Chimpanzee
Pan troglodytes
 
1.6 million+ - 1 source - - - - -
Cow
Bos taurus
 
104 million+ - 1 source -
Dog
Canis familiaris
 
5.9 million+ (+148) 1 source -
Fruitfly
Drosophila melanogaster
 
6.7 million+ - 1 source - - - - -
Gibbon
Nomascus leucogenys
 
1.1 million+ - 1 source - - - - - -
Goat
Capra hircus
 
37 million+   1 source - - - -
Horse
Equus caballus
 
21 million+ (+16 million) 1 source -
Human
Homo sapiens
 
329 million+ (+350,000) 6 sources
Macaque
Macaca mulatta
 
53 million+ - 1 source - - -
Mouse
Mus musculus
 
84 million+ - 1 source -
Opossum
Monodelphis domestica
 
1.1 million+ - 1 source - - - - - - -
Orangutan
Pongo abelii
 
10 million+ - 1 source - - - - - -
Pig
Sus scrofa
 
67 million+ - 3 sources -
Platypus
Ornithorhynchus anatinus
 
1.3 million+ - 1 source - - - - -
Rat
Rattus norvegicus
 
5 million+ - 1 source - -
S. cerevisiae
Saccharomyces cerevisiae
 
263,000+ - 1 source - - - - -
Sheep
Ovis aries
 
61 million+ - 1 source -
Tetraodon
Tetraodon nigroviridis
 
902,000+ - 1 source - - - - - - -
Turkey
Meleagris gallopavo
 
9,000+ - 1 source - - - - -
Zebra Finch
Taeniopygia guttata
 
1.7 million+ - 1 source - - - - -
Zebrafish
Danio rerio
 
17 million+ - 1 source -

列表中对应的Ensembl版本组装序列可以在这里找到。

大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。

Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,)。

# 突变信息展示

基因:突变表和突变图像。例如,KCNE2基因的所有突变

转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4

转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。

物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)

表型:显示与某种表型相关的变体的核型视图,例如,青光眼

# 参考资料

Ensembl

Ensembl突变数据描述之(一)——突变物种数据库及预测工具的更多相关文章

  1. Python数据描述与分析

    在进行数据分析之前,我们需要做的事情是对数据有初步的了解,比如对数据本身的敏感程度,通俗来说就是对数据的分布有大概的理解,此时我们需要工具进行数据的描述,观测数据的形状等:而后才是对数据进行建模分析, ...

  2. python - 数据描述符(class 内置 get/set/delete方法 )

    数据描述符(class 内置 get/set/del方法 ): # 什么是描述符 # 官方的定义:描述符是一种具有“捆绑行为”的对象属性.访问(获取.设置和删除)它的属性时,实际是调用特殊的方法(_g ...

  3. python小知识-属性查询优先级(如果有同名类属性、数据描述符、实例属性存在的话,实例>类>数据描述符)

    https://www.cnblogs.com/Jimmy1988/p/6808237.html https://segmentfault.com/a/1190000006660339 https:/ ...

  4. [py]数据描述符优先级

    实例查找属性的顺序: 类属性 > 数据描述符 > 实例属性 > 非数据描述符 > __getattr__ 类属性>数据描述符>实例属性 class Str: def ...

  5. python数据描述符

    Python的描述符是接触到Python核心编程中一个比较难以理解的内容,自己在学习的过程中也遇到过很多的疑惑,通过google和阅读源码,现将自己的理解和心得记录下来,也为正在为了该问题苦恼的朋友提 ...

  6. Object中defineProperty数据描述

    Object.defineProperty是对对象中的属性进行数据描述的 使用语法: Object.defineProperty(obj,prop,descriptor) 使用示例: var data ...

  7. (原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 决策树分析算法)

    随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结. 应用场景介绍 其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据 ...

  8. 如果数据为null,则转成数据库可识别的DBNULL.Value

    // <summary> /// 如果数据为null,则转成数据库可识别的DBNULL.Value /// </summary> /// <param name=&quo ...

  9. paip.将数据导入到在英语语音数据库mysql道路解决空原则问题

    paip.将数据导入到在英语语音数据库mysql道路解决空原则问题 #---原因:mysql 导入工具bug #---解决:不要使用双引号括注音. 笔者 老哇爪 Attilax 艾龙.  EMAIL: ...

随机推荐

  1. STM32F4XX高效驱动篇1-UART

    之前一直在做驱动方面的整理工作,对驱动的高效性有一些自己的理解这里和大家分享一下.并奉驱动程序,本程序覆盖uart1-8. 串口驱动,这是在每个单片机中可以说是必备接口.可以说大部分产品中都会使用,更 ...

  2. python3 函数 二

    1.函数嵌套 1.1函数嵌套定义 :在一个函数的内部,又定义另外一个函数. def f1():     x=1     def f2():         print('from f2')     f ...

  3. 左侧图片 右侧块的实现方法---解决3像素bug的一种解决方案,不用浮动用绝对定位和margin-left

    google的实现方式是: <div class="mw"> <a href="/" id="mlogo">  &l ...

  4. HTTP1.1与HTTP1.0

    本文转载自: http://www.cnblogs.com/shijingxiang/articles/4434643.html 1.可扩展性 a.在消息中增添版本号,用于兼容判断,版本号只能判断逐段 ...

  5. shell文件相关指令

    文件解压缩tar 请参考文档:http://blog.csdn.net/eroswang/article/details/5555415/ tar -zcvf ${standardpath}${fil ...

  6. 剑指offer之 二叉搜索树与双向链表

    class TreeNode { int val = 0; TreeNode left = null; TreeNode right = null; public TreeNode(int val) ...

  7. Can I run a local BLAST search again multiple blast databases simultaneously?

    from: https://secure.clcbio.com/helpspot/index.php?pg=kb.page&id=113 Can I run a local BLAST sea ...

  8. logstash的output插件

    logstash 的output插件 nginx,logstash和redis在同一台机子上 yum -y install redis,vim /etc/redis.conf 设置bind 0.0.0 ...

  9. sublime text _注册码

    转自:https://9iphp.com/web/html/sublime-text-3-license-key.html 使用方法 打开 Sublime Text 3 的 “Help”–“Enter ...

  10. php将一个二维数组按照某个字段值合并成一维数组,如果有重复则将重复的合并成二维数组

    版权声明:本文为博主原创文章,未经博主允许不得转载. 最近工作中碰到一个问题,用PHP将一个二维数组按照二维数组中的各个项中的某个特定字段值合并成一维数组,如果有重复则将重复的合并成二维数组,生成的二 ...