2. 在TCGA中找到并下载意向数据
听说过别人用生信分析“空手套白狼”的故事吧想做吗好想学哦~
或多或少都知道GEO和TCGA这些公共数据库吧!那么你知道怎么在数据库上找到意向数据,并且成功下载呢?这第一步要难倒一大票人。
- TCGA,The Cancer Genome Atlas
首先使用谷歌(海外)或必应(境内)搜索TCGA大家都知道,看到以下界面点进去
image.png
点进去后发现一堆官网介绍,简单查看每个小标签后并未找到数据下载的地方。当然啦,作为这么大一个项目,不可能仅用于数据下载,相应的首页应该会大量关于该项目的介绍、前景等等。耐心往下滑就会看到Access to TCGA data,这就是我们在什么都不知道的情况下,找到TCGA数据库的入口了。当然如果已知的话,就会知道搜索TCGA GDC了
image.png
Access to TCGA data
image.png
2. TCGA Genomic Data Commons Data Portal,TCGA GDC
2.1 把小手手悬停在选项卡上,可看到功能简介,当我们找到repository,就知道这是数据的储藏室了。
image.png
2.2 经过一系列参数设定后,选定要下载的数据,并加入到购物车中。
data
2.3 how to download data?
进入购物车界面后发现,哇~这些这些我都想要呢!但是怎么下载呢?一般来说如此大的项目会有官方说明,甚至TCGA还有自己专用的数据下载软件,具体请点击[GDC Data Transfer Tool]继续学习。
image.png
2.4 download data by GDC-Client
由于数据非常大,TCGA项目开发了高速且稳定的数据下载工具:GDC-client。在[GDC Data Transfer Tool]界面中会看到相关解释和客户端下载链接。
image.png
根据GDC data transfer tool的用户指导学习下载数据:点进用户指引后快速找到download选项卡,可以看到GDC data transfer tool有两种方式下载数据,具体user guide里面写得非常清楚了,这里及不再说明。
GDC user guide
本人选择方法1:Obtaining a Manifest File for Data Download
准备工作下载完毕
prepare
那么问题又来了,准备工作完毕,还是不知道如何下载数据呀?如果心里有此疑问,说明没有好好看完用户指南哦:用户指南中真的是一字一句的讲清楚如何下载数据并且已经提供了代码。
可能还会有疑问,这说明里面提到的是OS系统的下载方法,我大window怎么办呢?其实,window也可以打代码的,具体请学习Git Bash。当然如果不知道Git Bash,只要你发散想象力去思考,凭啥OS有,window就没有呢?那Windows到底有没有呢,这么一阵查下来也会查得到。总之无论如何,搜索大发好呀!但是很浪费时间也是真的了,干脆报个班算了。
image.png
一阵骚操作后,数据下载完毕。
2. 在TCGA中找到并下载意向数据的更多相关文章
- 未能在全局命名空间中找到类型或命名空间名称“Wuqi”
下载了AspNetPager控件用以进行分页操作,在项目中放入控件后,运行报错:未能在全局命名空间中找到类型或命名空间名称“Wuqi” . 解决办法:在项目下拉框“引用“中添加AspNetPager引 ...
- Dede CMS如何在文章中增加“附件下载”操作说明
1.进入后台--在"附件管理"中选择"上传新文件" 2.在"说明标题"输入要上传文件的名字,并在下面浏览找到要上传的文件,保存. 3.在&q ...
- SVN Error:请求的名称有效并且在数据库中找到,但是它没有相关的正确的数据来被解析
同事安装配置完Svn后一直down不下来文件,报错内容如下: Administrator 18:07:27 Checkout from https:/svn/web, revision HEAD, ...
- 如何从40亿整数中找到不存在的一个 webservice Asp.Net Core 轻松学-10分钟使用EFCore连接MSSQL数据库 WPF实战案例-打印 RabbitMQ与.net core(五) topic类型 与 headers类型 的Exchange
如何从40亿整数中找到不存在的一个 前言 给定一个最多包含40亿个随机排列的32位的顺序整数的顺序文件,找出一个不在文件中的32位整数.(在文件中至少确实一个这样的数-为什么?).在具有足够内存的情况 ...
- OSG中找到特定节点的方法
OSG中找到特定节点的方法 转自:http://38288890.blog.163.com/blog/static/19612845320072721549504/ 为了在OSG中找到需要的节点并对节 ...
- 【编程题目】在一个字符串中找到第一个只出现一次的字符。如输入 abaccdeff,则输出 b。
第 17 题(字符串):题目:在一个字符串中找到第一个只出现一次的字符.如输入 abaccdeff,则输出 b. 思路:此题非常容易. 最开始是想开辟一块空间存储每个字符出现的次数. 但转念一想,似乎 ...
- Javacard 解释器怎样在API类库中找到源文件调用的类、方法或者静态域?
申明:本篇非本人原创,是在阅读各种论文文献之后,对论文文献的一种梳理. 主要参考文献为: ------------------------------------------------------- ...
- OSG中找到特定节点的方法(转)
OSG中找到特定节点的方法 为了在OSG中找到需要的节点并对节点做出相应的操作,可以从NodeVisitor类中继承一个类,NPS的教程 [download id="14"] 阐述 ...
- 【技术贴】解决vss中提交pdf下载打开空白乱码
vss客户端需要安装一个Vss2005的补丁程序,而且之前上传的pdf文件重新删掉,再次上传进Vss中,再下载打卡就ok了. 补丁名称vs80-kb943847-x86-intl.exe 别人的csd ...
随机推荐
- C++从LPEXCEPTION_POINTERS获取调用堆栈
#pragma once #include <map> #include <vector> struct FunctionCall { DWORD64 Address; std ...
- CSDN自定义栏目代码
今天终于发现了csdn可以操作的地方,有个自定义栏目的地方可以贴HTML代码(只允许最多一个自定义栏目),不能用JS插件 有点难受,就贴了下自己的微信,并且可以直接点击图片发起会话 以下是我的代码,可 ...
- KUDU 学习笔记
Kudu 现存系统针对结构化数据存储与查询的一些痛点问题,结构化数据的存储,通常包含如下两种方式: 静态数据通常以Parquet/Carbon/Avro形式直接存放在HDFS中,吞吐能力大,适合离线分 ...
- Activiti7 流程变量(理论)
什么是流程变量 流程变量在Activiti中是一个非常重要的角色,流程运转有时需要靠流程变量,业务系统和Activiti结合时少不了流程变量,流程变量就是Activiti在管理工作流时根据管理需要而设 ...
- Jmeter-添加用户变量
1. 创建用户定义的变量. 2. 3. 4.输出结果:
- padding-top:100%解决高度塌陷问题
<div class="img_box"> <img src="http://sms-shop.oss-cnbeijing.aliyuncs.com/$ ...
- 关于非标准json格式转变为json对象
eval('(' + tempData + ')') 只需要这一句
- Ubuntu查看并修改主机名的方法
1 查看主机名 在Ubuntu系统中,快速查看主机名有多种方法: 在终端窗口中,主机名通常位于@符号后:root@lzyws739307453:~#例如这个的主机名就是lzyws739307453. ...
- 将虚拟机IP与主机IP设置在同一网段的方法
一.查看主机的网卡名称.IP地址.子网掩码 二.设置VMware Workstation软件 打开虚拟网络编辑器 弹出对话框,选择"更改设置"按钮. 进入虚拟网络编辑器 单选项选择 ...
- 提高SSH服务安全,ssh黑白名单
1.调整sshd服务配置,并重载服务 # vim /etc/ssh/sshd_config PermitRootLogin no #禁止root用户登录 Use ...