以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。

  我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。

  我们计算了人类每个突变在种群中的连锁不平衡。

突变数据类型

Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。

外部导入的数据(dbSNP、Sanger、DGVa、…):

碱基突变(SNP、插入、缺失、…)

结构突变(拷贝数变异、串联重复、反转、…)

检测拷贝数的变化

碱基突变和结构突变的位置

等位基因

人群

基因型

表型(例如,人类中的青光眼。)

引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)

计算数据(预测数据页面

储存突变数据的物种

Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP

  Short variant Long variant Genotype Association Prediction
Species Sequence variant (e!91 → e!92) Source(s) Structural variant Sample Population Phenotype Citation SIFT PolyPhen
Cat
Felis catus
 
3.6 million+ - 1 source - - - - - -
Chicken
Gallus gallus
 
24 million+ - 1 source - -
Chimpanzee
Pan troglodytes
 
1.6 million+ - 1 source - - - - -
Cow
Bos taurus
 
104 million+ - 1 source -
Dog
Canis familiaris
 
5.9 million+ (+148) 1 source -
Fruitfly
Drosophila melanogaster
 
6.7 million+ - 1 source - - - - -
Gibbon
Nomascus leucogenys
 
1.1 million+ - 1 source - - - - - -
Goat
Capra hircus
 
37 million+   1 source - - - -
Horse
Equus caballus
 
21 million+ (+16 million) 1 source -
Human
Homo sapiens
 
329 million+ (+350,000) 6 sources
Macaque
Macaca mulatta
 
53 million+ - 1 source - - -
Mouse
Mus musculus
 
84 million+ - 1 source -
Opossum
Monodelphis domestica
 
1.1 million+ - 1 source - - - - - - -
Orangutan
Pongo abelii
 
10 million+ - 1 source - - - - - -
Pig
Sus scrofa
 
67 million+ - 3 sources -
Platypus
Ornithorhynchus anatinus
 
1.3 million+ - 1 source - - - - -
Rat
Rattus norvegicus
 
5 million+ - 1 source - -
S. cerevisiae
Saccharomyces cerevisiae
 
263,000+ - 1 source - - - - -
Sheep
Ovis aries
 
61 million+ - 1 source -
Tetraodon
Tetraodon nigroviridis
 
902,000+ - 1 source - - - - - - -
Turkey
Meleagris gallopavo
 
9,000+ - 1 source - - - - -
Zebra Finch
Taeniopygia guttata
 
1.7 million+ - 1 source - - - - -
Zebrafish
Danio rerio
 
17 million+ - 1 source -

列表中对应的Ensembl版本组装序列可以在这里找到。

大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。

Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,)。

# 突变信息展示

基因:突变表和突变图像。例如,KCNE2基因的所有突变

转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4

转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。

物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)

表型:显示与某种表型相关的变体的核型视图,例如,青光眼

# 参考资料

Ensembl

Ensembl突变数据描述之(一)——突变物种数据库及预测工具的更多相关文章

  1. Python数据描述与分析

    在进行数据分析之前,我们需要做的事情是对数据有初步的了解,比如对数据本身的敏感程度,通俗来说就是对数据的分布有大概的理解,此时我们需要工具进行数据的描述,观测数据的形状等:而后才是对数据进行建模分析, ...

  2. python - 数据描述符(class 内置 get/set/delete方法 )

    数据描述符(class 内置 get/set/del方法 ): # 什么是描述符 # 官方的定义:描述符是一种具有“捆绑行为”的对象属性.访问(获取.设置和删除)它的属性时,实际是调用特殊的方法(_g ...

  3. python小知识-属性查询优先级(如果有同名类属性、数据描述符、实例属性存在的话,实例>类>数据描述符)

    https://www.cnblogs.com/Jimmy1988/p/6808237.html https://segmentfault.com/a/1190000006660339 https:/ ...

  4. [py]数据描述符优先级

    实例查找属性的顺序: 类属性 > 数据描述符 > 实例属性 > 非数据描述符 > __getattr__ 类属性>数据描述符>实例属性 class Str: def ...

  5. python数据描述符

    Python的描述符是接触到Python核心编程中一个比较难以理解的内容,自己在学习的过程中也遇到过很多的疑惑,通过google和阅读源码,现将自己的理解和心得记录下来,也为正在为了该问题苦恼的朋友提 ...

  6. Object中defineProperty数据描述

    Object.defineProperty是对对象中的属性进行数据描述的 使用语法: Object.defineProperty(obj,prop,descriptor) 使用示例: var data ...

  7. (原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 决策树分析算法)

    随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结. 应用场景介绍 其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据 ...

  8. 如果数据为null,则转成数据库可识别的DBNULL.Value

    // <summary> /// 如果数据为null,则转成数据库可识别的DBNULL.Value /// </summary> /// <param name=&quo ...

  9. paip.将数据导入到在英语语音数据库mysql道路解决空原则问题

    paip.将数据导入到在英语语音数据库mysql道路解决空原则问题 #---原因:mysql 导入工具bug #---解决:不要使用双引号括注音. 笔者 老哇爪 Attilax 艾龙.  EMAIL: ...

随机推荐

  1. Python 3 mysql 表操作

    Python 3 mysql 表操作 表相当于文件,表中的一条记录就相当于文件的一行内容,不同的是,表中的一条记录有对应的标题,称为表的字段 id,name,qq,age称为字段,其余的,一行内容称为 ...

  2. springmvc接受表单多条数据的值

    点击下面链接查看具体内容: http://blog.csdn.net/lutinghuan/article/details/46820023

  3. Codeforces 453B Little Pony and Harmony Chest:状压dp【记录转移路径】

    题目链接:http://codeforces.com/problemset/problem/453/B 题意: 给你一个长度为n的数列a,让你构造一个长度为n的数列b. 在保证b中任意两数gcd都为1 ...

  4. BZOJ 3391 [Usaco2004 Dec]Tree Cutting网络破坏:dfs【无根树 节点分枝子树大小】

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3391 题意: 给你一棵无根树,求分支size均不大于一半点数的点. 题解: 假定1为根. ...

  5. HTML5 学习记录——2

    20150826 1.声明文档类型 <!DOCTYPE>  声明HTML是用什么版本写的. 常用声明; 2.HYML头部元素   <head> <title> 定义 ...

  6. 目标检测 — Inception-ResNet-v2

    这篇文章介绍的网络有Inception V1.Inception V2.Inception V3.Inception V4与Inception-ResNet-V2. 1.Inception V1 主要 ...

  7. C#中string.Empty、""和null 之间的区别

    1.C#中string.Empty.""和null 之间的区别 (http://blog.csdn.net/henulwj/article/details/7830615)

  8. Python基础-处理json函数

    #json是一种通用的数据类型,所有的语言都认识#json是一个字符串,json串里面都得是双引号,主要是这四个函数 #dump#dumps#load#loads import jsonnames = ...

  9. php常用函数htmlspecialchars、strip_tags、addslashes解析

    本文章向大家介绍php开发中经常使用到的字符串函数htmlspecialchars.strip_tags.addslashes的使用方法及他们之间的区别,需要的朋友可以参考一下. 1.函数strip_ ...

  10. 简单使用c3p0连接池

    首先,c3p0是一个连接池插件 需要jar包: 使用手动配置: /** * 手动配置使用c3p0 * @throws PropertyVetoException * @throws SQLExcept ...