R中双表操作学习[转载]
转自:https://www.jianshu.com/p/a7af4f6e50c3
1.原始数据
以上是原有的一个,再生成一个新的:
> gene_exp_tidy2 <- data.frame(GeneId = rep("gene5", times = ),sample_name = paste("sample", :, sep = ""), expression = :)
> gene_exp_tidy2
GeneId sample_name expression
gene5 sample1
gene5 sample2
gene5 sample3
> mode(gene_exp_tidy2)
[] "list"
> typeof(gene_exp_tidy2)
[] "list"
//这个生成数据框的一句代码好厉害啊,学习了。
2.数据框拼接
# .使用R自带的函数rbind拼接
rbind(gene_exp_tidy,gene_exp_tidy2)
# .使用dplyr的bind_rows函数
bind_rows(gene_exp_tidy,gene_exp_tidy2)
其中对dplyr中拼接函数的说明:
包括按行合并和按列合并。也就是会改变表中y的值。
3.交集
3.1构建一个gene1和gene5组成的数据框
gene_exp_tidy3 <- filter(gene_exp_tidy, GeneId == "gene1")%>%
bind_rows(gene_exp_tidy2)
//就是过滤吧,从原来的当中根据列名过滤,列名中的内容=gene1的列,然后进行合并到变量2的行上。结果如上。
3.2求交集
# 求两个数据框的交集
intersect(gene_exp_tidy, gene_exp_tidy3)
3.3并集(自动去重)
# 求两个数据框的并集(自动去除重复)
union(gene_exp_tidy, gene_exp_tidy3)
3.3并集(不去重)
# 求两个数据框的并集,不去除重复
union_all(gene_exp_tidy, gene_exp_tidy3)
//是三个元素完全相同,才会判断为相同的。
3.4求差集
# 求两个数据框的差集
setdiff(gene_exp_tidy, gene_exp_tidy3)
4表连接操作
4.1内连接
上图中,左边的数据框中有基因的表达信息,右边的数据框中有基因的功能注释,如何把两个数据框相关联,将基因功能注释添加到基因的表达信息中呢?
//也就是以左边的表为基准,查看当前geneid是否在右边表中出现,如果出现,则合并呗。
左连接:以第一个数据框为准,将第二个数据框的相关信息添加进去
# 将两张表以GeneId进行关联
left_join(gene_exp_tidy, gene_anno, by = "GeneId")
对于如果两个表的列名不恰好相同的话,使用以下语句:
# 使用rename函数将GeneId换成Geneid
gene_anno <- rename(gene_anno, Geneid = GeneId)
# 将两个数据框关联,设置两个数据框中相同的列名
left_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))
by中是一个向量,左边表的列名=右边表的列名 。结果与上述是一样的结果。
4.2右连接
右连接:以第二个数据框为准,将第一个数据框中的相关信息添加进去
# 右连接
right_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))
4.3内连接:保留两个数据框中共有的GeneId
# 内连接
inner_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))
4.4全连接:保留两张表格中所有GeneId的信息
# 全连接
full_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))
4.5半连接
半连接:只保留第二个数据框中包含的GeneId信息
//应该是只根据c中的保留表2中的列,不会进行其他列的信息合并。
4.6反连接:只保留第二个数据框中不包含的GeneId信息
# 反连接
anti_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))
R中双表操作学习[转载]的更多相关文章
- R中字符串操作
简介 Stringr中包含3个主要的函数族 字符操作 空格处理 模式匹配 常用函数 在平常的数据分析工作中,经常要用到如下的函数 函数 操作 str_length() 获取字符串长度 str_sub( ...
- ant中copy操作学习心得(转)
Ant真是太方便了,以前都没注意到它.功能很强大,能创建数据库,配置服务器,部署发布应用……只需要写好build.xml文件,剩下的就交给ant来“安装”你的WEB应用了. Appfuse的第一个an ...
- JavaScript中NODE操作学习总结
Node: 1.在 HTML DOM (文档对象模型)中,每个部分都是节点: 文档本身是文档节点 所有 HTML 元素是元素节点 所有 HTML 属性是属性节点 HTML ...
- R之ddlpy函数学习[转载]
转自:https://www.cnblogs.com/aloiswei/p/6032513.html 1.函数 ddply(.data, .variables, .fun = NULL, ..., . ...
- 碎片︱R语言与深度学习
笔者:受alphago影响,想看看深度学习,但是其在R语言中的应用包可谓少之又少,更多的是在matlab和python中或者是调用.整理一下目前我看到的R语言的材料: ---------------- ...
- R中基本函数学习[转载]
转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 ...
- C#中使用Redis学习二 在.NET4.5中使用redis hash操作
上一篇>> 摘要 上一篇讲述了安装redis客户端和服务器端,也大体地介绍了一下redis.本篇着重讲解.NET4.0 和 .NET4.5中如何使用redis和C# redis操作哈希表. ...
- R语言中的正则表达式(转载:http://blog.csdn.net/duqi_yc/article/details/9817243)
转载:http://blog.csdn.net/duqi_yc/article/details/9817243 目录 Table of Contents 1 正则表达式简介 2 字符数统计和字符翻译 ...
- R 中的哪些命令或者包让你相见恨晚?--转载知乎
https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Had ...
随机推荐
- Delphi中ClientDataSet的用法小结
Delphi中ClientDataSet的用法小结 TClientDataSet控件继承自TDataSet,其数据存储文件格式扩展名为 .cds,是基于文件型数据存储和操作的控件.该控件封装了对数据进 ...
- 【Spring系列】Spring AOP面向切面编程
前言 接上一篇文章,在上午中使用了切面做防重复控制,本文着重介绍切面AOP. 在开发中,有一些功能行为是通用的,比如.日志管理.安全和事务,它们有一个共同点就是分布于应用中的多处,这种功能被称为横切关 ...
- JS - 二叉树算法实现与遍历 (更新中...)
一.关于二叉树: 截图来自:https://segmentfault.com/a/1190000000740261 温馨提示:学习以及使用二叉树概念,心中永远有这么一个图,对于理解和接受二叉树有很大的 ...
- 笔者使用macOS的一些经验点滴记录1
(1) 输入法快捷键 ctrl+shift+p 拼音 ctrl+shift+W 五笔型 按CapsLock可以在英文与指定中文输入法间进行切换 (2) 定时关机 sudo shutdown -h ...
- Python tkinter 控件更新信息
下面几个例子关于tkinter界面更新的,简单易懂,分享一下. 例子_1: 代码_1: from tkinter import Tk, Checkbutton, Label from tkinter ...
- 解决Ubuntu刚装好的时候su命令密码错误的问题
Ubuntu刚安装后,在terminal中运行su命令会要求输入密码,然而无论输什么都会错,直接回车也是错,这因为root没有默认密码,需要手动设定.以安装ubuntu时输入的用户名登陆,该用户在ad ...
- Elasticsearch学习之深入搜索二 --- 搜索底层原理剖析
1. 普通match如何转换为term+should { "match": { "title": "java elasticsearch"} ...
- LeetCode 32 Longest Valid Parentheses(最长合法的括号组合)
题目链接: https://leetcode.com/problems/longest-valid-parentheses/?tab=Description Problem :已知字符串s,求出其 ...
- sencha touch 在线实战培训 第一期 第三节
2014.1.2晚上8点开的课 讲课进度比较快,好多同学反应说有些跟不上了... 呃,本期的课程是需要有一定的基础的. 建议大家多看看http://www.cnblogs.com/mlzs/p/346 ...
- jenkins部署war包到远程服务器的tomcat
一.目的 jenkins上将war包,部署到远程服务器的tomcat上. 这边tomcat在windows 主机A上,版本apache-tomcat-8.5.23. jenkins在主机B上,cent ...