想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件:

1-生物信息学:导论与方法  北大\10 生物信息数据库及软件资源

一个优秀的生信开发者能够解决如下问题:

  • 如何鉴定一个重要的且没有被解决的生物学问题?
  • 如何将该问题转化为一个可计算的问题?
  • 如何提出一个解决此问题的算法?
  • 如何实现该算法?
  • 如何评估算法?

生信工具使用者需要解决如下问题:

  • 每个方法解决的是哪个生物学问题?
  • 该方法有哪些基本的假设?
  • 每个参数是什么意思,都是用来干什么的?
  • 准确度评估,sensitivity and specificity,tradeoff,应该追求哪一个?
  • 生物学问题和方法的局限性?

生信资源的分类:

  • 集中资源&独立资源
  • 数据库&软件工具
  • 原始数据库&二级数据库
  • 命令行工具&网页服务器工具

NCBI

EBI

UCSC Genome Browser:基因组浏览器,表达调控、变异数据,track,ENCODE 非编码元件(计划)

集中资源

NCBI

EBI

UCSC

链接

DatabaseToolsResource List(A-Z)

by topic

by name

Table Browser

Genome Browser

Tools

BLAST

BLAST、Exonerate、ClustalW2

BLAT、In-Silico PCR

Data Repository

GenBank、GEO、SRA

ArrayExpress、ENA、PDBe

ENCODE

DNA/Genome

Genome

Ensembl、Genomes

Ideogram、Recombination Rate、GC Content

DNA/Gene

Gene

Ensembl

UCSC Genes、GENCODE、RefSeq Genes

RNA

RefSeq

Ensembl

mRNAs、ESTs、UniGene

Proteins

Protein, RefSeq、Conserved Domain

UniProt、InterPro、PRIDE

Expression

UniGene

Expression、Atlas

Affy Exon Array、Caltech RNA-seq、Allen Brain

Regulation

Transcription、TFBS、Epigenetics、DNaseI HS

Literature

PubMed

Ontology

Gene Ontology

Comparative Genomics

Taxonomy、HomoloGene

*Ensembl

Conservation、Neandertal

Variation

dbSNP、dbVar

*Ensembl

SNPs、DGV、RepeatMasker

Disease

OMIM、MeSH、dbGaP、ClinVar

GAD、COSMIC、ClinVar、GWAS Catalog、QTLs

独立资源

 


癌症

DNAnexus Reanalyzes Cancer Genome Atlas Data

DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载) - 基因慧

DNANexus:DNANexus专注于建立一个云计算服务器中的DNA数据库,然后以服务方式将该数据库提供给研究者和科学家。DNAnexus和谷歌开展技术合作,提供最为全面的DNA数据库,它可通过美国国家生物技术信息中心(NCBI)下SRA的网站访问到这些DNA数据(2011年2月,NCBI曾宣布由于联邦政府削减经费支持逐步淘汰SRA)。

Cancer Genome Atlas:泛癌症基因组

The Cancer Genome Atlas:就是 TCGA 的全称,Atlas 古希腊的一个神

TCGA 官网   User Guides and Help

生物信息大数据&数据库(NCBI、EBI、UCSC、TCGA)的更多相关文章

  1. 大数据数据库HBase(一)——架构原理

    一.HBase简介 1.1.Hadoop生态系统 1.2.非关系型数据库知识面扩展  Cassandra hbase mongodb Couchdb,文件存储数据库 Neo4j非关系型图数据库 1.3 ...

  2. 大数据数据库HBase(二)——搭建与JavaAPI

    一.搭建 1.选择一台没有ZK的机器(HBase自带ZK,可能会导致冲突) 2.选择版本2.0.5的HBase 3.解压HBase2.0.5 4.配置HBase的HBASE_HOME和path 5.修 ...

  3. 大数据时代数据库-云HBase架构&生态&实践

    业务的挑战 存储量量/并发计算增大 现如今大量的中小型公司并没有大规模的数据,如果一家公司的数据量超过100T,且能通过数据产生新的价值,基本可以说是大数据公司了 .起初,一个创业公司的基本思路就是首 ...

  4. 图解大数据 | 海量数据库查询-Hive与HBase详解

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...

  5. [Hadoop 周边] Hadoop和大数据:60款顶级大数据开源工具(2015-10-27)【转】

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

  6. Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  7. 【转载】Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  8. 阿里云HBase全新发布X-Pack 赋能轻量级大数据平台

    一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储.持续8年的投入,历经8年双十一锻 ...

  9. Hadoop和大数据:60款顶级开源工具(山东数漫江湖)

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

随机推荐

  1. RDIFramework.NET ━ 9.7 操作权限项管理 ━ Web部分

    RDIFramework.NET ━ .NET快速信息化系统开发框架 9.7 操作权限项管理 -Web部分 随着经济全球化趋势的发展和企业间竞争的加剧,企业对管理要求不断变化.提高,越来越多的信息都表 ...

  2. 第一次尝试编写java

    昨晚手贱,不小心把环境变量path里面都东西全删除了 然后上百度搜了一波又一波 最后还是复制达达的 感动 然后还是不行,最后发现错误竟然是分号用了汉字的分号而不是英文的分号 这个问题在编写C语言也出现 ...

  3. 2.1.5 计算机网络协议: TCP/IP

    应用程序阶段:妳打开浏览器,在浏览器上面输入网址列,按下 [Enter].此时网址列与相关数据会被浏览器包成一个数据, 并向下传给 TCP/IP 的应用层: 应用层:由应用层提供的 HTTP 通讯协议 ...

  4. FastJSON 之bean列表转换为JSON

    实例 import java.util.ArrayList; import java.util.List; import com.alibaba.fastjson.JSON; public class ...

  5. .NET 使用CouchBase 基础篇

    2011年2月,CouchOne和memebase合并后,改名为Couchbase,官网地址(www.couchbase.com).membase最后一个版本为1.7.2,可在Couchbase的官网 ...

  6. IE8 下 select option 内容过长 , 展开时信息显示不全解决办法

    IE8 下 select option 内容过长 , 展开时信息显示不全 , 简单折衷的方式就是给 option 加上 title 属性 , 但是又不想一个个的修改,怎么办呢,代码如下 : //sel ...

  7. python基本数据类型之集合set

    一.集合的定义 set集合,是一个无序且不重复的元素集合. 集合对象是一组无序排列的可哈希的值,集合成员可以做字典中的键.集合支持用in和not in操作符检查成员,由len()内建函数得到集合的基数 ...

  8. JAVA基础知识之JDBC——使用ResultSetMetaData分析结果集

    通过ResultSetMetaData可以对ResultSet进行分析,获取ResultSet里包含了哪些数据列,以及每个列的数据类型. ResultSet中包含了一个getMetaData()方法, ...

  9. android 常见的泄漏内存方法和 leakcanary 使用方法

    虽然VM接管了内存分配和回收,但是人类在解决问题的同时也会重新创造出一些新的问题,所以问题永远都解决不了,就产生各种稀奇古怪的就业机会了(跑题跑不停). 无论各种VM用什么算法管理内存, 造成内存泄漏 ...

  10. fidder 使用教程

    fidder 使用教程 1. Fiddler 是什么? Fiddler是用C#编写的一个免费的HTTP/HTTPS网络调试器.英语中Fiddler是小提琴的意思,Fiddler Web Debugge ...