NCBI SRA数据库】的更多相关文章

转:https://shengxin.ren/article/16 https://www.cnblogs.com/lmt921108/p/7442699.html 批量下载SRA http://www.360doc.com/content/18/0428/15/48272598_749456477.shtml  我的下载的数据在/home/username/ncbi/public/sra SRA(Sequence ReadArchive)数据库是用于存储二代测序的原始数据,包括 454,Ill…
简介 SRA数据库是美国国立卫生研究院(NIH)的高通量测序数据的主要归档,是国际核苷酸序列数据库协作(INSDC)的一部分,其中包括NCBI序列读取存档(SRA),欧洲生物信息学研究所(EBI)和DNA数据库 日本(DDBJ). 提交给三个组织中的任何一个的数据都是共享的. SRA数据库数据来自高通量测序平台(Roche 454 GSSystem®,Illumina GenomeAnalyzer®,Applied Biosystems SOLiDSystem®,HelicosHeliscope…
SRA - NCBI example - NCBI 要发文章了,审稿时编辑肯定会要求你上传NGS测序数据. 一般数据都是放在集群,不可能放在个人电脑上,因为有的数据大的吓人(几个T). 所以我们就建一个文件夹,然后把所有需要的fastq文件链接到这个文件夹就行了(copy太慢,也太占空间). 接下来,如何NCBI账号申请好了,那就可以直接上传了,用aspera来上传. 命令如下: ~/.aspera/connect/bin/ascp -i ~/download/aspera.openssh -Q…
本文近期更新地址: http://blog.csdn.net/tanzuozhev/article/details/51078460 前文 http://blog.csdn.net/tanzuozhev/article/details/51077222 介绍了如何採用 sra-toolkit 下载 sra 文件,可是假设你想下载整个项目的全部样本.应该如何批量下载呢.以下參考biostar站点的部分回帖.做简介. R语言 SRAdb 包 參考 https://www.biostars.org/p…
本文近期更新地址: http://blog.csdn.net/tanzuozhev/article/details/51077222 随着測序技术的不断提高.二代測序数据成指数增长. NCBI提供了SRA数据库存储这些数据. http://www.ncbi.nlm.nih.gov/sra 为了方便更好的分析这些数据,NCBI提供了下载的命令行工具:sra-toolkit. 包含下面命令: 官方文档: http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi…
下了一些sra数据库中的公共数据,因为pretech和aspera不稳定,稍微大点的文件经常传断,部分文件我只能通过本地下载再上传. 那么问题来了,sra没有md5校验,我怎么知道我数据的完整性,尤其是通过本地下载的那些数据? 网上查了下是说,sra是自带md5校验的(The SRA archive format ("vdb") contains an md5 checksum as well as a few other consistency checks (I think). T…
目录 1.Conda连接不上镜像源问题 2. aspera不能再独立使用 3.使用prefetch搭配aspera 4. prefetch下载方法 记录下下载过程,为自己和后人避坑. 1.Conda连接不上镜像源问题 首先是anaconda安装软件或创建环境时遇到的问题.即使换完清华源和其他镜像源以后依旧报错. CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsi 尝试了很多方法:换源,删除.co…
GEO数据库 GEO数据库隶属于NCBI,是最大最全面的基因表达数据库,主要是芯片和转录组测序数据.除储存数据外,也提供一些数据挖掘工具,因此利用好这个数据库,没有实验,没有自己的数据也能发好文章! https://www.ncbi.nlm.nih.gov/geo/   SRA文件的存放 从NCNI的这个站点(https://www.ncbi.nlm.nih.gov/projects/faspftp/)可以看出,sra原始的reads数据是在sra/sra-instant/下的,该目录下的ana…
SRA数据的的处理流程大概如下 一.SRA数据下载. NCBI 上存储的数据现在大都存储为SRA格式. 下载以后就是以SRA为后缀名. 这里可以通过三种方式下载SRA格式的数据. 1.通过http方式,2.通过ftp方式,3.通过Aspera Aspera可以在NCBI网站上下载. 参阅:http://www.ncbi.nlm.nih.gov/books/NBK47540/ 二.SRA格式转换成FASTQ格式 ./fastq-dump -A SRR058977 ~/project/yanzi/d…
RNA-seq 测序可以用于融合基因的发现,在过去的十几年里,RNA-seq 测序数据不断增加,发现的融合基因的数据也不断增加: FusionCancer 是一个人类癌症相关的融合基因的数据库,利用NCBI SRA数据库中的RNA-seq 数据,采用tophat-fusion, soap-fusion, fusionmap, chimerascan 4款预测融合基因的软件进行预测: 网址如下: http://donglab.ecnu.edu.cn/databases/FusionCancer/…