NCBI之gene系列】的更多相关文章

1.基因系列中的data索引 2.基因ID之间的转换 对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自如. 今天主要记录几个ID转换的方式: 以果蝇为例 详细的了解阅读下面:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README 1.从NCBI下载基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Inverte…
1)介绍 来自NCBI的Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库. 这些数据包括基于单通道和双通道微阵列的实验,测量mRNA,基因组DNA和蛋白质丰度:以及非阵列技术,如基因表达系列分析(SAGE)和质谱蛋白质组学数据. 在GEO最基本的组织级别中,用户可以提供四种实体类型:平台,样本,系列和GEO数据集. 1.1 平台(platforms): 平台记录描述阵列上的元件列表(例如,cDNA,寡核苷酸探针组,ORF,抗体)或可在该实验中检测和定量的…
HGNC 全称为HUGO Gene Nomenclature Committee, 叫做 HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因, ncRNA基因,甲基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol; 数据库的主页为 http://www.genenames.org/ 对于每个human的基因来说,在HGNC数据库中会有一个数字标识的唯一ID, 也会有一个唯一的symbol, HCNC数据库提供了免费下载的功能: 下载对应的链接,命令为 lftp…
KEGG 官网提供了API, 可以方便的访问KEGG 数据库中的内容,链接如下: http://www.kegg.jp/kegg/rest/keggapi.html 利用API可以得到某一个基因参与的pathway 信息, 以human 为例: 1) 第一步,获取每条pathway具体的描述信息 对应的API为 : http://rest.kegg.jp/list/pathway/hsa 内容如下: 可以看到,返回的内容一共两列,第一列为物种对应的pathway, 第二列为该pathway 对应…
DAVID网站提供了id转换的功能 1 选择上传gene list文件 2 选择上传ID的类型,我们ID-list.txt中的是Ensembl Gene ID,所以这里选ENSEMBL_GENE_ID 3 这个是类型,因为只做ID转换,所以选Gene List就ok了 4 选择你要转换的ID类型,这里我选的ENTREZ_GENE_ID 5 然后选择提交就ok了 bioDBnet 1 输入文件ID类型 2 输出ID类型,这里的Gene ID就是指ENTREZ GENE ID 3 输入ID列表,点击…
昨天开始学用Cytoscape,其tutorial分为两个部分,基础的和高级 的.基础教程又分成了四课:Getting Started.Filters & Editor.Fetching External Data和Expression Analysis.为防忘记,做个摘记. 第一课 新手上路 地址:http://wiki.cytoscape.org/Presentations/01_Get_Started Cytoscape可以本地安装,也可以web start.软件得用java,所以要装JR…
SRA - NCBI example - NCBI 要发文章了,审稿时编辑肯定会要求你上传NGS测序数据. 一般数据都是放在集群,不可能放在个人电脑上,因为有的数据大的吓人(几个T). 所以我们就建一个文件夹,然后把所有需要的fastq文件链接到这个文件夹就行了(copy太慢,也太占空间). 接下来,如何NCBI账号申请好了,那就可以直接上传了,用aspera来上传. 命令如下: ~/.aspera/connect/bin/ascp -i ~/download/aspera.openssh -Q…
Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和自由分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据. 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式. GEO的数据储存方式 GEO数据库具体存放四类数据:GSE.GDS.GSM.和GPL. 一个GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台: 一个GDS号(GDSxxx)对应的一个同一平台的数据集…
NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源.NCBI资源包括Entrez.Entrez编程组件.MyNCBI.PubMed.PudMed Central.PubReader.Gene.the NCBI Taxonomy Browser.BLAST.Pimer-Blast.COBALT.RefSeq.UniGene.HomoloGene.ProtES…
GEO  Gene Expression Omnibus 基因表达数据库 网址:https://www.ncbi.nlm.nih.gov/geo/ GEO的数据存储方式 GEO数据库具体存放四类数据:GSE.GDS.GSM.GPL GEO Series Study  GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能会涉及不同平台. GEO DataSet  GDS号(GDSxxx)对应的是一个同一平台的数据集,这些包括包括从微整列和高通量序列技术生成的数据. GEO Sample …