目前,在NCBI中下载SRA数据主要有三种方式:

  • 利用Aspera工具下载。
  • 利用SRA Toolkit下载。
  • 利用wget命令直接下载

第三种最为方便。其中的关键是得到下载数据的链接,即ftp的地址

进入NCBI网页后,按如下步骤操作:

  • Step1.设置NCBI的分类为:SRA
  • Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
  • Step3.点击右上角的Send to
  • Step4.在Choose Destination中选择File
  • Step5.在Format输入栏选择RunInfo
  • Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。

wget -c 50 下载地址

若想批量下载则把下载地址放到一个list里面,然后运行下面的代码:

wget -c 50 -i list.txt

下面这个网址里面也有一些内容可供参考:

https://www.jianshu.com/p/0694fcb77157

https://www.cnblogs.com/zdwu/p/8473986.html

下载好的数据是sra压缩格式,这个格式是ncbi特有的一种格式,需要将此格式的文件转换成fastq文件的格式

sra是NCBI 推出的存储高通量数据的格式,而平常我们工作用得多是fastq格式。如果需要把sra 转成fastq,从
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=software
下载相应的软件。
或者下载最新的source code,在服务器上用make 编译。
然后使用如下命令行:
sra_sdk-2.0.0rc1/linux/rel/gcc/x86_64/bin/fastq-dump -A SRR034580 -D SRR034580.sra
这样就可以很简单的把sra格式转成fastq格式了。

转换 .sra 文件成  .fastq/fasta 文件

#single-end 单端测序

.../fastq-dump  DRR000003.sra               # 结果生成DRR000003.fastq

.../fastq-dump  --fasta  DRR000003.sra   # 结果生成DRR000003.fastq

#pair-end  双端测序

.../fastq-dump --split-3  DRR002018.sra    #  结果生成   DRR002018_1.fastq,DRR002018_2.fastq

REF:
http://blog.sina.com.cn/s/blog_4055a5940100o1mg.html
http://hi.baidu.com/wuyu466/item/152006eb4363eac3baf37d29
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
http://blog.sina.com.cn/s/blog_70b2b6020100liee.html

在NCBI中下载SRA数据的更多相关文章

  1. NCBI下载sra数据(新)

      今天要上NCBI下载sra数据发现没有下载的链接,网上查发现都是老的方法,NCBI页面已经变更,于是看了NCBI的help,并且记录下来新版的sra数据下载方法,要用NCBI的工具SRA Tool ...

  2. NCBI下载SRA数据

    从NCBI下载数据本来是一件很简单的事情,但是今天碰到几个坑: 1.paper里没有提供SRA数据号.也没有提供路径: 2.不知道文件在ftp的地址,不能直接用wget下载 所以通过在NCBI官网,直 ...

  3. 用R包来下载sra数据

    1)介绍 我们用SRAdb library来对SRA数据进行处理. SRAdb 可以更方便更快的接入  metadata associated with submission, 包括study, sa ...

  4. Windows系统中下载Earthdata数据

    总的来说,为四大步: 1.注册Earthdata用户. 注册时需注意的是,最好把所有需打勾的都勾上,在最后[注册]按钮前,弹出[人机验证]才能注册成功.如果注册不成功,除了检查用户名和密码是否符合要求 ...

  5. 如何利用efetch从NCBI中批量下载数据?

    目录 找序列 下序列 假设我要从NCBI中下载全部水稻的mRNA序列,如何实施? 找序列 第一步,肯定是找到相关序列. 我从ncbi taxonomy进入,搜索oryza.因为要搜索mRNA核酸序列, ...

  6. 2021-2-3-利用anaconda+prefetch+aspera从NCBI的SRA数据库中下载原始测序数据

    目录 1.Conda连接不上镜像源问题 2. aspera不能再独立使用 3.使用prefetch搭配aspera 4. prefetch下载方法 记录下下载过程,为自己和后人避坑. 1.Conda连 ...

  7. NCBI SRA数据预处理

    SRA数据的的处理流程大概如下 一.SRA数据下载. NCBI 上存储的数据现在大都存储为SRA格式. 下载以后就是以SRA为后缀名. 这里可以通过三种方式下载SRA格式的数据. 1.通过http方式 ...

  8. 在ASP.NET MVC中利用Aspose.cells 将查询出的数据导出为excel,并在浏览器中下载。

    正题前的唠叨 本人是才出来工作不久的小白菜一颗,技术很一般,总是会有遇到一些很简单的问题却不知道怎么做,这些问题可能是之前解决过的.发现这个问题,想着提升一下自己的技术水平,将一些学的新的'好'东西记 ...

  9. 利用Aspose.cells 将查询出的数据导出为excel,并在浏览器中下载。

    正题前的唠叨 本人是才出来工作不久的小白菜一颗,技术很一般,总是会有遇到一些很简单的问题却不知道怎么做,这些问题可能是之前解决过的.发现这个问题,想着提升一下自己的技术水平,将一些学的新的‘好’东西记 ...

  10. 2. 在TCGA中找到并下载意向数据

    听说过别人用生信分析"空手套白狼"的故事吧想做吗好想学哦~ 或多或少都知道GEO和TCGA这些公共数据库吧!那么你知道怎么在数据库上找到意向数据,并且成功下载呢?这第一步要难倒一大 ...

随机推荐

  1. SpringBoot为什么这么火?

    1.  总的设计原则是""默认大于配置"" 2. Starter机制,开箱即用,默认的配置和依赖都是默认加载的 3. SpringBoot是Spring的子类, ...

  2. Antlr语法优化过程记录

    背景 Modelica Spec中的语法文件在Antlr下表现很糟糕,至少是1个数量级的糟糕的性能表现 理论 语义谓词减慢速度 ATN图中多分支转换为单分支 可选放在词法开头和语法的结尾 避免前导可选 ...

  3. linux check folder files how many files

    https://linuxhandbook.com/count-number-files/ tree -a

  4. 下载base64图片

    下载 this.downloadFile('二维码',that.img64) downloadFile(fileName, content) { let aLink = document.create ...

  5. windows下运行.sh文件

    1.安装git,配置git环境(D:\Tools\Git\cmd) .cmd命令检查是否安装成功(git --version). 2.打开Git Bash窗口,命令运行.sh文件. 3.运行.sh文件 ...

  6. DOM DEM DLG DRG

    以下有不同的说法,但是意思都很相近.一. DOM (数字正射影像图):利用数字高程模型对扫描处理的数字化的航空相片.遥感影像,经逐个像元纠正,按图幅范围裁切生成的影像数据,它的信息比较直观,具有良好的 ...

  7. mount无响应

    mount -t xfs /dev/sdb /data 挂载不成功,且命令无任何回显. dmesg 查看到有报错 tailf /var/log/messages -n 100 systemctl da ...

  8. SQL Server性能优化

    源代码文件 1,什么是性能问题? 现有资源没有达到最大吞吐量的前提下,系统不能满足合理的预期表现,则可以定义为有性能问题.性能指标包括:响应时间,吞吐量,可扩展性. 2,初探优化 2.1优化论 一般遇 ...

  9. docker容器启动报错Unable to access jarfile

    1.错误表现 Errot: Unable to access jarfile /opt/run-java/deployments/chiano.jar 2.原因:容器的基础镜像对jar的权限有要求 3 ...

  10. 处理code中代码格式化与eslint冲突

    在结尾去掉分号 让字符串格式化之后用单引号表示 去掉格式化后自动给末尾加的逗号 在根目录下新建一个文件prettierrc 输入如下 函数名与()之间取消空格 打开eslintrc.js 输入如下代码 ...