7、sraToolkit安装使用
参考:http://blog.csdn.net/Cs_mary/article/details/78378552 ###prefetch 参数解释
https://www.ncbi.nlm.nih.gov/books/NBK158900/#SRA_download.how_do_i_use_the_sra_toolki ## convert data into a particular format (fastq-dump等)
https://github.com/ncbi/sra-tools/wiki/Downloads ###sra-tools软件的下载,不同系统(Centos ubuntu window)
http://blog.csdn.net/xubo245/article/details/50513201 ###用Aspera connect从NCBI上下载SRA格式数据
https://indexofire.gitbooks.io/notebook_of_analyzing_pathogen_ngs_data/content/chapter_1/sra.html
http://boyun.sh.cn/bio/?p=1933
一. window
1.下载地址:
http://downloads.asperasoft.com/connect2/
2.下载:
数据下载地址:
http://www.ncbi.nlm.nih.gov/projects/faspftp/1000genomes/
其他地址:
http://www.1000genomes.org/aspera
二 linux
1、下载安装
http://downloads.asperasoft.com/
curl -O http://download.asperasoft.com/download/sw/connect/3.6.1/aspera-connect-3.6.1.110647-linux-64.tar.gz
tar zxf asper-commect-3.6.1.110647-linux.tar.gz
sh aspera-connect-2.4.7.37118-linux-64.sh
2、##加入路径
echo "alias acsp=/home/sxuan/.aspera/connect/bin/ascp" >> ~/.bashrc
3、下载地址查找:http://www.ncbi.nlm.nih.gov/Traces/study/
1)单个下载:ascp -i /your-path-to/.aspera/connect/etc/asperaweb_id_dsa.openssh anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR689/SRR689250/SRR689250.sra ./
2)批量下载:整理成下面的格式黏贴在文本SRR_Download_List_file_list.txt 中:
/sra/sra-instant/reads/ByRun/sra/SRR/SRR689/SRR689250/SRR689250.sra
/sra/sra-instant/reads/ByRun/sra/SRR/SRR893/SRR893046/SRR893046.sra
nohup ascp -i /share/home/jialj/.aspera/connect/etc/asperaweb_id_dsa.putty --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list SRR_Download_List_file_list.txt ./ &
三 prefetch直接调用ascp,没有安装ascp之前直接用http
-f | –force Force object download. One of: no, yes, all. no [default]: Skip download if the object if found and complete; yes: Download it even if it is found and is complete; all: Ignore lock files (stale locks or if it is currently being downloaded: use at your own risk!).
强制下载
默认:文件已经存在则跳过
yes: 即使已存在完整文件仍然下载
–transport Value one of: ascp (only), http (only), both (first try ascp, fallback to http). Default: both.
传输
默认: 先尝试ascp, 再尝试http
-l | –list List the contents of a kart file.
列表kart文件
-s | –list-sizes List the content of kart file with target file sizes.
列表Kart文件及文件大小
-N | –min-size Minimum file size to download in KB (inclusive).
最小下载文件大小
-X | –max-size Maximum file size to download in KB (exclusive). Default: 20G.
最大下载文件大小
默认 20G
-o | –order Kart prefetch order. One of: kart (in kart order), size (by file size: smallest first). default: size.
Kart文件下载顺序
默认:按文件大小顺序下载
-a | –ascp-path
prefetch -a “/opt/aspera/bin/ascp|/opt/aspera/etc/asperaweb_id_dsa.openssh” SRR390728
When the toolkit is unable to locate an installed version of Aspera, the location of ascp and ssh key (-a /opt/aspera/bin/ascp|/opt/aspera/bin/asperaweb_id_dsa.openssh”) can be provided.
无法自动调用Aspera时就需要提供ascp的路径和密钥
prefetch -t ascp -a “/opt/aspera/bin/ascp|/opt/aspera/bin/asperaweb_id_dsa.openssh” --list SRR.file
prefetch -c SRR390728
This command will check the availability of all needed reference sequences (-c) for a given accession.
检查给定序列号是否可以能够下载
=====================================
批量下载SRRxxxxxx
# 如何下载多个文件?创建一个含有SRR runs的文件。
echo SRR1553608 > sra.ids
echo SRR1553605 >> sra.ids
# 用这个文件去prefetch对应的runs.
prefetch --option-file sra.ids
# 拆包下载好的所有文件。请注意下边的做法不是特别妥当,因为(文件夹里)除了我们用sra.ids下载的,可能还有别的prefetch下来的文件。
fastq-dump --split-files ~/ncbi/public/sra/SRR15536*
--split-files: By using this, one single SRR file will download as SRRxxx_1.fastq and SRRxxx_2.fastq.
--split-3: which splits your SRR into 3 files: one for read 1, one for read 2, and one for any orphan reads (ie: reads that aren’t present in both files). This is important for downstream analysis, as some aligners require your paired reads to be in sync (ie: present in each file at the same line number) and orphan reads can throw this order off.
7、sraToolkit安装使用的更多相关文章
- linux 安装SAMtools,bcftools,htslib,sratoolkit,bedtools,GATK,TrimGalore,qualimap,vcftools,bwa
--------------------安装Samtools---------------------------------------------------------------------- ...
- docker——容器安装tomcat
写在前面: 继续docker的学习,学习了docker的基本常用命令之后,我在docker上安装jdk,tomcat两个基本的java web工具,这里对操作流程记录一下. 软件准备: 1.jdk-7 ...
- 网络原因导致 npm 软件包 node-sass / gulp-sass 安装失败的处理办法
如果你正在构建一个基于 gulp 的前端自动化开发环境,那么极有可能会用到 gulp-sass ,由于网络原因你可能会安装失败,因为安装过程中部分细节会到亚马逊云服务器上获取文件.本文主要讨论在不变更 ...
- Sublime Text3安装JsHint
介绍 Sublime Text3使用jshint依赖Nodejs,SublimeLinter和Sublimelinter-jshint. NodeJs的安装省略. 安装SublimeLinter Su ...
- Fabio 安装和简单使用
Fabio(Go 语言):https://github.com/eBay/fabio Fabio 是一个快速.现代.zero-conf 负载均衡 HTTP(S) 路由器,用于部署 Consul 管理的 ...
- gentoo 安装
加载完光驱后 1进行ping命令查看网络是否通畅 2设置硬盘的标识为GPT(主要用于64位且启动模式为UEFI,还有一个是MBR,主要用于32位且启动模式为bois) parted -a optima ...
- Linux平台 Oracle 10gR2(10.2.0.5)RAC安装 Part3:db安装和升级
Linux平台 Oracle 10gR2(10.2.0.5)RAC安装 Part3:db安装和升级 环境:OEL 5.7 + Oracle 10.2.0.5 RAC 5.安装Database软件 5. ...
- Linux平台 Oracle 10gR2(10.2.0.5)RAC安装 Part1:准备工作
Linux平台 Oracle 10gR2(10.2.0.5)RAC安装 Part1:准备工作 环境:OEL 5.7 + Oracle 10.2.0.5 RAC 1.实施前准备工作 1.1 服务器安装操 ...
- 【原】nodejs全局安装和本地安装的区别
来微信支付有2年多了,从2年前的互联网模式转变为O2O模式,主要的场景是跟线下的商户去打交道,不像以往的互联网模式,有产品经理提需求,我们帮忙去解决问题. 转型后是这样的,团队成员更多需要去寻找业务的 ...
随机推荐
- 第二十三篇、IO多路复用 二
基于IO多路复用实现socket的连接 下面流程:1.先创建列表,让自己的socket对象传入,然后遍历select第一个参数2.客户端连接,那么客户端socket就传入到了列表里面,3.遍历,接收客 ...
- linux通过脚本获取内存信息
1 原理 脚本中通过执行free获取内存信息,然后将文本信息通过“空格”分隔符分割成字符串数组将不同信息提取出来,最后通过bc计算出百分比 2 脚本 #!/bin/shHOSTNAME=`hostna ...
- codeforces 676B 模拟 递推
题意:每秒从最高处的杯子倒一杯酒下来,酒流的方式如图,问t秒装满酒的杯子的数目. 思路:把第一杯的值设为t,glass[i][j]=(glass[i-1][j-1]-1)/2+(glass[i-1][ ...
- RabbitMQ之Exchange Direct模式
场景: 生产者发送消息到交换机并指定一个路由key, 消费者队列绑定到交换机时要指定路由key(key匹配就能接受消息,key不匹配就不能接受消息) 例如:我们可以把路由key设置为insert ,那 ...
- sqlserver 函数里并返回一个表格数据拼接的字符串
Create function [dbo].[GetChildWorkerExtension]( @ChildId int)returns nvarchar(100)asbegin ...
- Javascript-- jQuery 核心
jQuery中each方法的应用 jQuery中有个很重要的核心方法each,大部分jQuery方法在内部都会调用each,其主要的原因的就是jQuery的实例是一个元素合集 如下:找到所有的div, ...
- 【Codeforces Round #466】E. Cashback DP+ST表
题意 给定$n$个数,将其划分成若干个连续的子序列,求最小价值,数组价值定义为,数组和减去$\lfloor \frac{k}{c} \rfloor$,$k$为数组长度,$c$为给定数 可以列得朴素方程 ...
- codeforces 710B B. Optimal Point on a Line(数学)
题目链接: B. Optimal Point on a Line 题意: 给出n个点,问找出一个点使得这个点到所有的点的距离和最小; 思路: 所有点排序后的中位数;这是一个结论; AC代码: #inc ...
- codeforces 707A A. Brain's Photos(水题)
题目链接: A. Brain's Photos 题意: 问是黑白还是彩色; 思路: 没有思路: AC代码: #include <iostream> #include <cstdio& ...
- urllib,urlib2与httplib,urllib3
urllib:编码参数离不开urllib,urllib.urlencode, urllib.urlopen(URL,[,data]) 支持POST,根据参数区分post或者get urllib2:发送 ...