Tidyverse|数据列的分分合合,爱恨情仇
Tidyverse|数据列的分分合合,爱恨情仇
本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一
TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要。
比如基因列为ID的需要转为常见的symbol,基因列为symbol|ID的就需要拆开了!
excel分列可以解决,但是表达量数据较大,且excel容易产生“数据变形”。
一, 载入数据,R包
使用TCGA下载的数据,使用以下几行几列, 作为示例
library(tidyverse)
data <- read.csv("separate.csv",header = TRUE, check.name = FALSE)
head(data)
ID ID2 TCGA-18-3406-01A-01R-0980-07 TCGA-18-3407-01A-01R-0980-07
1 A1BG|1 A1BG/1 741.6929 46.7127
2 A1CF|29974 A1CF/29974 0.0000 0.4757
3 A2BP1|54715 A2BP1/54715 0.0000 0.0000
4 A2LD1|87769 A2LD1/87769 170.2362 118.4063
5 A2ML1|144568 A2ML1/144568 128.3465 1413.4158
6 A2M|2 A2M/2 9074.6772 11310.1713
可以看到第一列的ID,和人为添加的ID2,名称不规则,我们只需要前面的基因名。
二,合久可分 - 一列拆多列
使用separate函数, 将“指定”分隔符出现的位置一列分成多列
2.1 默认,不指定分隔符
data %>%
separate(ID, into = c("Gene", "IDnum")) %>% head()
2.2 指定分隔符且保留原始列
data %>%
separate(ID2, into = c("Gene2", "IDnum2"),sep = "/",remove = FALSE) %>%
head()
2.3 特殊字符的指定方式
data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "l",remove = FALSE) %>%
head()
按照同样的方式,想把"|"分隔的ID拆分,发现报错。?黑人问号脸
有问题可以先?separate或者help(separate)查询帮助函数,"|"为特殊字符,可以使用"[|]"括起来或者"\\|",均可:
data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "[|]",remove = FALSE) %>% head()
#或者
data2 <- data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "\\|",remove = FALSE)
2.4,按照第几个字符拆
根据第几个字符拆分,适合数据规整的,,,
可以用来将TCGA中的sampleID转为常见的16位,需要先转置
#
data2 %>% select(Gene1,contains("TCGA")) %>% #选择指定列
column_to_rownames(var = "Gene1") %>% # 将Gene1列转为rownames
t() %>% as.data.frame() %>% #数据转置,样本为行名
rownames_to_column(var="Sample") %>% #行名变为数据中的列
separate(Sample, into = c("Sample", "bar"),sep = 16) %>% #按照规则取前16个字符
select(-bar) #去掉分割后不需要的bar列
可参考:盘一盘Tidyverse| 筛行选列之select,玩转列操作
Tips:
1)可以先默认试一下,如2.1所示;
2)使用R的帮助,一定!
三,分久必合-多列合并一列
使用unite函数, 可将多列按照“指定”分隔符合并为一列
data %>%
unite(ID_new, ID:ID2, sep = "_") %>% head()
◆ ◆ ◆ ◆ ◆
Tidyverse|数据列的分分合合,爱恨情仇的更多相关文章
- 注解:大话AOP与Android的爱恨情仇
		
转载:大话AOP与Android的爱恨情仇 1. AOP与OOP的区别 平时我接触多的就是OOP(Object Oriented Programming面向对象).AOP(Aspect Oriente ...
 - 对json的爱恨情仇
		
本文回想了对json的爱恨情仇. C++有风险,使用需慎重. 本文相关代码在:http://download.csdn.net/detail/baihacker/7862785 当中的測试数据不在里面 ...
 - String、StringBuilder、StringBuffer的爱恨情仇
		
第三阶段 JAVA常见对象的学习 StringBuffer和StringBuilder类 (一) StringBuffer类的概述 (1) 基本概述 下文以StringBuffer为例 前面我们用字符 ...
 - pytorch和tensorflow的爱恨情仇之基本数据类型
		
自己一直以来都是使用的pytorch,最近打算好好的看下tensorflow,新开一个系列:pytorch和tensorflow的爱恨情仇(相爱相杀...) 无论学习什么框架或者是什么编程语言,最基础 ...
 - pytorch和tensorflow的爱恨情仇之定义可训练的参数
		
pytorch和tensorflow的爱恨情仇之基本数据类型 pytorch和tensorflow的爱恨情仇之张量 pytorch版本:1.6.0 tensorflow版本:1.15.0 之前我们就已 ...
 - pytorch和tensorflow的爱恨情仇之张量
		
pytorch和tensorflow的爱恨情仇之基本数据类型:https://www.cnblogs.com/xiximayou/p/13759451.html pytorch版本:1.6.0 ten ...
 - pytorch和tensorflow的爱恨情仇之参数初始化
		
pytorch和tensorflow的爱恨情仇之基本数据类型 pytorch和tensorflow的爱恨情仇之张量 pytorch和tensorflow的爱恨情仇之定义可训练的参数 pytorch版本 ...
 - Menu与ActionBar的爱恨情仇
		
最近在开发一款音乐播放器,在开发过程中遇到了一点小麻烦,通过android API搞清楚了Menu与ActionBar的爱恨情仇,写了个小Demo祭奠一下那些年我们陷进去的坑,有不对的地方请大神们批评 ...
 - web移动端fixed布局和input等表单的爱恨情仇 - 终极BUG,完美解决
		
[问题]移动端开发,ios下当fixed属性和输入框input(这里不限于input,只要可以调用移动端输入法的都包括,如:textarea.HTML5中contenteditable等),同时存在的 ...
 
随机推荐
- pycharm 2.7 快捷键
			
提示 CTRL Q: 在参数列表位置,显示可以输入的所有参数 CTRL Q: 查看选中方法的文档字符串 阅读 CTRL -: 折叠当前代码 CTRL +: 展开当前代码 CTRL SHIFT -: 折 ...
 - Mysql数据库主键,外键,索引概述
			
主键: 主键是数据表的唯一索引,比如学生表里有学号和姓名,姓名可能有重名的,但学号确是唯一的,你要从学生表中搜索一条纪录如查找一个人,就只能根据学号去查找,这才能找出唯一的一个,这就是主键;如:id ...
 - SpringBoot环境搭建及第一个程序运行(详细!)
			
spring boot简介 spring boot框架抛弃了繁琐的xml配置过程,采用大量的默认配置简化我们的开发过程. 所以采用Spring boot可以非常容易和快速地创建基于Spring 框架的 ...
 - LeetCode(一) jump game
			
一. 1. #include<iostream> #include<cmath> using namespace std; bool CanJump(int n[],int n ...
 - ADB 调试
			
1.adb简介 adb的全称为Android Debug Bridge,就是起到调试桥的作用.通过adb我们可以在Eclipse中方面通过DDMS来调试Android程序,说白了就是debug工具.a ...
 - vulnhub~DC-9
			
首先对于整体的思路,网上有很多的教程,如果国内的不能满足建议‘fanqiang’,Google有很多大佬,各个部分都有详细的说明.但又由于每个人的环境都有所不同,所以会在同样的命令行执行后出现不同的错 ...
 - Light of future-冲刺Day 5
			
目录 1.SCRUM部分: 每个成员进度 SCRUM 会议的照片 签入记录 代码运行截图 用户浏览界面 订单详情界面 管理员浏览界面 新增后台界面 2.PM 报告: 时间表 燃尽图 任务总量变化曲线 ...
 - Spring MVC 笔记--配置基于JavaConfig
			
主要使用基于 JavaConfig 方式配置 配置 DispatcherServlet 通过继承抽象类AbstractAnnotationConfigDispatcherServletInitiali ...
 - Pytest系列(10) - firture 传参数 request的详细使用
			
如果你还想从头学起Pytest,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1690628.html 前言 为了提高复用性,我们在写测试 ...
 - flask-redirect
			
flask-redirect from flask import Flask, url_for, request, redirect app = Flask(__name__) @app.route( ...