以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。

  我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。

  我们计算了人类每个突变在种群中的连锁不平衡。

突变数据类型

Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。

外部导入的数据(dbSNP、Sanger、DGVa、…):

碱基突变(SNP、插入、缺失、…)

结构突变(拷贝数变异、串联重复、反转、…)

检测拷贝数的变化

碱基突变和结构突变的位置

等位基因

人群

基因型

表型(例如,人类中的青光眼。)

引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)

计算数据(预测数据页面

储存突变数据的物种

Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP

  Short variant Long variant Genotype Association Prediction
Species Sequence variant (e!91 → e!92) Source(s) Structural variant Sample Population Phenotype Citation SIFT PolyPhen
Cat
Felis catus
 
3.6 million+ - 1 source - - - - - -
Chicken
Gallus gallus
 
24 million+ - 1 source - -
Chimpanzee
Pan troglodytes
 
1.6 million+ - 1 source - - - - -
Cow
Bos taurus
 
104 million+ - 1 source -
Dog
Canis familiaris
 
5.9 million+ (+148) 1 source -
Fruitfly
Drosophila melanogaster
 
6.7 million+ - 1 source - - - - -
Gibbon
Nomascus leucogenys
 
1.1 million+ - 1 source - - - - - -
Goat
Capra hircus
 
37 million+   1 source - - - -
Horse
Equus caballus
 
21 million+ (+16 million) 1 source -
Human
Homo sapiens
 
329 million+ (+350,000) 6 sources
Macaque
Macaca mulatta
 
53 million+ - 1 source - - -
Mouse
Mus musculus
 
84 million+ - 1 source -
Opossum
Monodelphis domestica
 
1.1 million+ - 1 source - - - - - - -
Orangutan
Pongo abelii
 
10 million+ - 1 source - - - - - -
Pig
Sus scrofa
 
67 million+ - 3 sources -
Platypus
Ornithorhynchus anatinus
 
1.3 million+ - 1 source - - - - -
Rat
Rattus norvegicus
 
5 million+ - 1 source - -
S. cerevisiae
Saccharomyces cerevisiae
 
263,000+ - 1 source - - - - -
Sheep
Ovis aries
 
61 million+ - 1 source -
Tetraodon
Tetraodon nigroviridis
 
902,000+ - 1 source - - - - - - -
Turkey
Meleagris gallopavo
 
9,000+ - 1 source - - - - -
Zebra Finch
Taeniopygia guttata
 
1.7 million+ - 1 source - - - - -
Zebrafish
Danio rerio
 
17 million+ - 1 source -

列表中对应的Ensembl版本组装序列可以在这里找到。

大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。

Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,)。

# 突变信息展示

基因:突变表和突变图像。例如,KCNE2基因的所有突变

转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4

转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。

物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)

表型:显示与某种表型相关的变体的核型视图,例如,青光眼

# 参考资料

Ensembl

Ensembl突变数据描述之(一)——突变物种数据库及预测工具的更多相关文章

  1. Python数据描述与分析

    在进行数据分析之前,我们需要做的事情是对数据有初步的了解,比如对数据本身的敏感程度,通俗来说就是对数据的分布有大概的理解,此时我们需要工具进行数据的描述,观测数据的形状等:而后才是对数据进行建模分析, ...

  2. python - 数据描述符(class 内置 get/set/delete方法 )

    数据描述符(class 内置 get/set/del方法 ): # 什么是描述符 # 官方的定义:描述符是一种具有“捆绑行为”的对象属性.访问(获取.设置和删除)它的属性时,实际是调用特殊的方法(_g ...

  3. python小知识-属性查询优先级(如果有同名类属性、数据描述符、实例属性存在的话,实例>类>数据描述符)

    https://www.cnblogs.com/Jimmy1988/p/6808237.html https://segmentfault.com/a/1190000006660339 https:/ ...

  4. [py]数据描述符优先级

    实例查找属性的顺序: 类属性 > 数据描述符 > 实例属性 > 非数据描述符 > __getattr__ 类属性>数据描述符>实例属性 class Str: def ...

  5. python数据描述符

    Python的描述符是接触到Python核心编程中一个比较难以理解的内容,自己在学习的过程中也遇到过很多的疑惑,通过google和阅读源码,现将自己的理解和心得记录下来,也为正在为了该问题苦恼的朋友提 ...

  6. Object中defineProperty数据描述

    Object.defineProperty是对对象中的属性进行数据描述的 使用语法: Object.defineProperty(obj,prop,descriptor) 使用示例: var data ...

  7. (原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 决策树分析算法)

    随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结. 应用场景介绍 其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据 ...

  8. 如果数据为null,则转成数据库可识别的DBNULL.Value

    // <summary> /// 如果数据为null,则转成数据库可识别的DBNULL.Value /// </summary> /// <param name=&quo ...

  9. paip.将数据导入到在英语语音数据库mysql道路解决空原则问题

    paip.将数据导入到在英语语音数据库mysql道路解决空原则问题 #---原因:mysql 导入工具bug #---解决:不要使用双引号括注音. 笔者 老哇爪 Attilax 艾龙.  EMAIL: ...

随机推荐

  1. [原创]java WEB学习笔记43:jstl 介绍,core库详解:表达式操作,流程控制,迭代操作,url操作

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

  2. uitableview 刷新一行

    ios UITableview 刷新某一行 或 section   //一个section刷新     NSIndexSet *indexSet=[[NSIndexSet alloc]initWith ...

  3. 【海量之道】海量之道之SET模型

    本文介绍了set模型. 一 提供海量服务时面对的场景 场景1:如何令黄村机房的TWS机器访问黄村机房的APP服务,避免TWS跨机房调用永丰机房的APP机器? 场景2:DB和Redis如何实现快慢分离, ...

  4. 分享知识-快乐自己:MyBtis内置缓存机制

    在实际的项目开发中,通常对数据库的查询性能要求很高,而mybatis提供了查询缓存来缓存数据,从而达到提高查询性能的要求. mybatis的查询缓存分为一级缓存和二级缓存,一级缓存是SqlSessio ...

  5. string 中的 length函数 和size函数 返回值问题

    string 中的 length函数 和 size函数 的返回值  (  还有 char [ ] 中 测量字符串的  strlen 函数 ) 应该是 unsigned int 类型的 不可以 和 -1 ...

  6. python 链接MS SQL

    cnxn = pyodbc.connect(driver='{SQL Server}', host=server, database=db1, trusted_connection=tcon, use ...

  7. JSP的一个增删改查例子和总结

    总结的几点: 1.在jsp中注意<%! %>声明代码块中的变量只会在项目开始的时候第一次运行jsp的时候执行一遍,有点类似于java类中的static代码块,所以如果是会改变的值不应该声明 ...

  8. Linux-NoSQL之Redis(三)

    一.Redis数据常用操作 1.string常用操作 set key1  aminglinux get key1 set key1  aming //一个key对应一个value,多次赋值,会覆盖前面 ...

  9. pandas 学习 —— pivot table

    0. DataFrame 的 index.columns.values >> df = pd.DataFrame(np.arange(6).reshape(3, 2), index=['o ...

  10. C语言逗号运算符和逗号表达式

    在C语言中逗号","也是一种运算符,称为逗号运算符. 其功能是把两个表达式连接起来组成一个表达式, 称为逗号表达式.其一般形式为:表达式1,表达式2 其求值过程是分别求两个表达式的 ...