想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件:

1-生物信息学:导论与方法  北大\10 生物信息数据库及软件资源

一个优秀的生信开发者能够解决如下问题:

  • 如何鉴定一个重要的且没有被解决的生物学问题?
  • 如何将该问题转化为一个可计算的问题?
  • 如何提出一个解决此问题的算法?
  • 如何实现该算法?
  • 如何评估算法?

生信工具使用者需要解决如下问题:

  • 每个方法解决的是哪个生物学问题?
  • 该方法有哪些基本的假设?
  • 每个参数是什么意思,都是用来干什么的?
  • 准确度评估,sensitivity and specificity,tradeoff,应该追求哪一个?
  • 生物学问题和方法的局限性?

生信资源的分类:

  • 集中资源&独立资源
  • 数据库&软件工具
  • 原始数据库&二级数据库
  • 命令行工具&网页服务器工具

NCBI

EBI

UCSC Genome Browser:基因组浏览器,表达调控、变异数据,track,ENCODE 非编码元件(计划)

集中资源

NCBI

EBI

UCSC

链接

DatabaseToolsResource List(A-Z)

by topic

by name

Table Browser

Genome Browser

Tools

BLAST

BLAST、Exonerate、ClustalW2

BLAT、In-Silico PCR

Data Repository

GenBank、GEO、SRA

ArrayExpress、ENA、PDBe

ENCODE

DNA/Genome

Genome

Ensembl、Genomes

Ideogram、Recombination Rate、GC Content

DNA/Gene

Gene

Ensembl

UCSC Genes、GENCODE、RefSeq Genes

RNA

RefSeq

Ensembl

mRNAs、ESTs、UniGene

Proteins

Protein, RefSeq、Conserved Domain

UniProt、InterPro、PRIDE

Expression

UniGene

Expression、Atlas

Affy Exon Array、Caltech RNA-seq、Allen Brain

Regulation

Transcription、TFBS、Epigenetics、DNaseI HS

Literature

PubMed

Ontology

Gene Ontology

Comparative Genomics

Taxonomy、HomoloGene

*Ensembl

Conservation、Neandertal

Variation

dbSNP、dbVar

*Ensembl

SNPs、DGV、RepeatMasker

Disease

OMIM、MeSH、dbGaP、ClinVar

GAD、COSMIC、ClinVar、GWAS Catalog、QTLs

独立资源

 


癌症

DNAnexus Reanalyzes Cancer Genome Atlas Data

DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载) - 基因慧

DNANexus:DNANexus专注于建立一个云计算服务器中的DNA数据库,然后以服务方式将该数据库提供给研究者和科学家。DNAnexus和谷歌开展技术合作,提供最为全面的DNA数据库,它可通过美国国家生物技术信息中心(NCBI)下SRA的网站访问到这些DNA数据(2011年2月,NCBI曾宣布由于联邦政府削减经费支持逐步淘汰SRA)。

Cancer Genome Atlas:泛癌症基因组

The Cancer Genome Atlas:就是 TCGA 的全称,Atlas 古希腊的一个神

TCGA 官网   User Guides and Help

生物信息大数据&数据库(NCBI、EBI、UCSC、TCGA)的更多相关文章

  1. 大数据数据库HBase(一)——架构原理

    一.HBase简介 1.1.Hadoop生态系统 1.2.非关系型数据库知识面扩展  Cassandra hbase mongodb Couchdb,文件存储数据库 Neo4j非关系型图数据库 1.3 ...

  2. 大数据数据库HBase(二)——搭建与JavaAPI

    一.搭建 1.选择一台没有ZK的机器(HBase自带ZK,可能会导致冲突) 2.选择版本2.0.5的HBase 3.解压HBase2.0.5 4.配置HBase的HBASE_HOME和path 5.修 ...

  3. 大数据时代数据库-云HBase架构&生态&实践

    业务的挑战 存储量量/并发计算增大 现如今大量的中小型公司并没有大规模的数据,如果一家公司的数据量超过100T,且能通过数据产生新的价值,基本可以说是大数据公司了 .起初,一个创业公司的基本思路就是首 ...

  4. 图解大数据 | 海量数据库查询-Hive与HBase详解

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...

  5. [Hadoop 周边] Hadoop和大数据:60款顶级大数据开源工具(2015-10-27)【转】

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

  6. Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  7. 【转载】Hadoop和大数据:60款顶级大数据开源工具

    一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

  8. 阿里云HBase全新发布X-Pack 赋能轻量级大数据平台

    一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储.持续8年的投入,历经8年双十一锻 ...

  9. Hadoop和大数据:60款顶级开源工具(山东数漫江湖)

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...

随机推荐

  1. h5的radio和check选中和不选中返回的checkd值

    h5的radio和check选中和不选中返回的checkd值 alert($('input[type=checkbox]').attr('checked')); //存在返回checked,不存在返回 ...

  2. grabcut

    http://blog.csdn.net/zouxy09/article/details/8535087

  3. c#大文件分割过程

    需求: 在项目开发中,我们会遇到单个文件大小超过1TB的文件,这样的文件只能进行单文件读取,往往会造成读取完成耗时过长,导致客户在使用体验过程中不满意. 为了解决提升大文件的解析速度,我想到了先分割大 ...

  4. IntelliJ IDEA Community Edition 14.1.4下使用 Apache-Subversion搭建代码管理环境

    当前我的idea 版本是14.1.4. 1,)SVN Server下载与安装(https://www.visualsvn.com/server/): 因为我开发机是x64的,所以我优先下载 x64的 ...

  5. 纯CSS实现帅气的SVG路径描边动画效果(转载)

    本文转载自: 纯CSS实现帅气的SVG路径描边动画效果

  6. paper 106:图像增强方面的介绍

    图像增强是从像素到像素的操作,是以预定的方式改变图像的灰度直方图.有时又称为对比度增强,灰度变换.点运算不可能改变图像内的空间关系,输出像素的灰度值由输入像素的值决定.其作用: 对比度增强:扩展感兴趣 ...

  7. AJAX-----14HTML5中新增的API---files

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  8. 在linux中访问virtualbox的共享文件夹

    1.在客户机里需要安装Virtualbox的增强功能. 2.使用virtualbox的图形界面设置好共享文件夹. 3.假设你设置的共享文件夹的名称是 share,使用如下命令在客户机的linux系统中 ...

  9. 《zw版·Halcon-delphi系列原创教程》 Halcon分类函数·简明中文手册 总览

    <zw版·Halcon-delphi系列原创教程> Halcon分类函数·简明中文手册 总览 Halcon函数库非常庞大,光HALCONXLib_TLB.pas文件,源码就要7w多行,但核 ...

  10. [转]ASP.NET MVC Json()处理大数据异常解决方法 json maxjsonlength

    本文转自:http://blog.csdn.net/blacksource/article/details/18797055 先对项目做个简单介绍: 整个项目采用微软的ASP.NET MVC3进行开发 ...