GEOquery】的更多相关文章

1)介绍 来自NCBI的Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库. 这些数据包括基于单通道和双通道微阵列的实验,测量mRNA,基因组DNA和蛋白质丰度:以及非阵列技术,如基因表达系列分析(SAGE)和质谱蛋白质组学数据. 在GEO最基本的组织级别中,用户可以提供四种实体类型:平台,样本,系列和GEO数据集. 1.1 平台(platforms): 平台记录描述阵列上的元件列表(例如,cDNA,寡核苷酸探针组,ORF,抗体)或可在该实验中检测和定量的…
最近需要下载一大批GEO上的数据,问题是我要下载的Methylation数据根本就没有sra文件,换言之不能使用Aspera之类的数据进行下载.但是后来我发现了GEOquery这个不错的R包,不知道是网络问题还是怎么,GEOquery有时候运行也不太稳定,但是总体来说,很好地解决了我的问题. 首先假设我们想要下载的数据是GSE77445,这是一批DNA甲基化数据,我们可以在R语言中安装GEOquery之后,载入R包,然后直接输入: Data <- getGEO("GSE77445"…
https://www.plob.org/article/9969.html Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,甚至高通量测序数据! GEO数据库基础知识 GEO Platform (GPL) 芯片平台 GEO Sample (GSM) 样本ID号 GEO Series (GSE) study的ID号 GEO Dataset (GDS) 数据集的ID号…
1.简介 关于空间数据搜索,以前写过<使用Solr进行空间搜索>这篇文章,是基于Solr的GIS数据的索引和检索. Solr和ElasticSearch这两者都是基于Lucene实现的,两者都可以进行空间搜索(Spatial Search),在有些场景,我们需要把Lucene嵌入到已有的系统提供数据索引和检索的功能,这篇文章介绍下用Lucene如何索引带有经纬度的POI信息并进行检索. 2.环境数据 Lucene版本:5.3.1 POI数据库:Base_Station测试数据,每条数据主要是I…
摘录自:CIPS2016 中文信息处理报告<第二章 语义分析研究进展. 现状及趋势>P14 CIPS2016> 中文信息处理报告下载链接:http://cips-upload.bj.bcebos.com/cips2016.pdf 任何对语言的理解都可以归为语义分析的范畴.一段文本通常由词.句子和段落来构成,根据理解对象的语言单位不同, 语义分析又可进一步分解为词汇级语义分析.句子级语义分析以及篇章级语义分析. 语义分析的目标就是通过建立有效的模型和系统, 实现在各个语言单位 (包括词汇.…
儿童定位手表,有个交友功能,查找附近的人,用redis的geo来实现比较简单,其实是一个ZSET(有序集合) redis 版本要大于3.2 查看redis 版本    /usr/bin/redis-server      --version 注意引入的jar版本:可能运行时候会报错,这时要检查jar包的版本,可能版本冲突导致报错 public class Coordinate { //经度 private double longitude; //纬度 private double latitud…
*** glibc detected *** /usr/lib64/R/bin/exec/R: free(): invalid next size (fast): 0x000000000263a420 *** ======= Backtrace: ========= /lib64/libc.so.6[0x313a47dda6] /lib64/libc.so.6[0x313a47f08e] /home/phoxis/Documents/Works/Programming/R/libmetis.so…
source("http://bioconductor.org/biocLite.R") biocLite("GEOquery") library(Biobase) rm(list = ls()) #清空内存 R语言常用命令 http://blog.sina.com.cn/s/blog_9f23a8da010195qx.html > getwd() #获取工作目录. > setwd("F:/R/myfun") #设定工作目录为F:/R…
转载:http://www.bio-info-trainee.com/1327.html 收集了那么多的癌症细胞系的表达数据,拷贝数变异数据,突变数据,总不能放着让它发霉吧! 这些数据可以利用的地方非常多,但是在谷歌里面搜索引用了它的文章却不多,我挑了其中几个,解读了一下别人是如何利用这个数据的,当然,主要是用那个mRNA的表达数据咯! 第一篇:http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0111146 这篇文…
Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和自由分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据. 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式. GEO的数据储存方式 GEO数据库具体存放四类数据:GSE.GDS.GSM.和GPL. 一个GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台: 一个GDS号(GDSxxx)对应的一个同一平台的数据集…