转自:https://www.jianshu.com/p/a7af4f6e50c3

1.原始数据

以上是原有的一个,再生成一个新的:

> gene_exp_tidy2 <- data.frame(GeneId = rep("gene5", times = ),sample_name = paste("sample", :, sep = ""), expression = :)
> gene_exp_tidy2
GeneId sample_name expression
gene5 sample1
gene5 sample2
gene5 sample3
> mode(gene_exp_tidy2)
[] "list"
> typeof(gene_exp_tidy2)
[] "list"

//这个生成数据框的一句代码好厉害啊,学习了。

2.数据框拼接

# .使用R自带的函数rbind拼接
rbind(gene_exp_tidy,gene_exp_tidy2)
# .使用dplyr的bind_rows函数
bind_rows(gene_exp_tidy,gene_exp_tidy2)

其中对dplyr中拼接函数的说明:

包括按行合并和按列合并。也就是会改变表中y的值。

3.交集

3.1构建一个gene1和gene5组成的数据框

gene_exp_tidy3 <- filter(gene_exp_tidy, GeneId == "gene1")%>%
bind_rows(gene_exp_tidy2)

//就是过滤吧,从原来的当中根据列名过滤,列名中的内容=gene1的列,然后进行合并到变量2的行上。结果如上。

3.2求交集

# 求两个数据框的交集
intersect(gene_exp_tidy, gene_exp_tidy3)

3.3并集(自动去重)

# 求两个数据框的并集(自动去除重复)
union(gene_exp_tidy, gene_exp_tidy3)

3.3并集(不去重)

# 求两个数据框的并集,不去除重复
union_all(gene_exp_tidy, gene_exp_tidy3)

//是三个元素完全相同,才会判断为相同的。

3.4求差集

# 求两个数据框的差集
setdiff(gene_exp_tidy, gene_exp_tidy3)

4表连接操作

4.1内连接

上图中,左边的数据框中有基因的表达信息,右边的数据框中有基因的功能注释,如何把两个数据框相关联,将基因功能注释添加到基因的表达信息中呢?

//也就是以左边的表为基准,查看当前geneid是否在右边表中出现,如果出现,则合并呗。

左连接:以第一个数据框为准,将第二个数据框的相关信息添加进去

# 将两张表以GeneId进行关联
left_join(gene_exp_tidy, gene_anno, by = "GeneId")

对于如果两个表的列名不恰好相同的话,使用以下语句:

# 使用rename函数将GeneId换成Geneid
gene_anno <- rename(gene_anno, Geneid = GeneId)
# 将两个数据框关联,设置两个数据框中相同的列名
left_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

by中是一个向量,左边表的列名=右边表的列名 。结果与上述是一样的结果。

4.2右连接

右连接:以第二个数据框为准,将第一个数据框中的相关信息添加进去

# 右连接
right_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.3内连接:保留两个数据框中共有的GeneId

# 内连接
inner_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.4全连接:保留两张表格中所有GeneId的信息

# 全连接
full_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.5半连接

半连接:只保留第二个数据框中包含的GeneId信息

//应该是只根据c中的保留表2中的列,不会进行其他列的信息合并。

4.6反连接:只保留第二个数据框中不包含的GeneId信息

# 反连接
anti_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

R中双表操作学习[转载]的更多相关文章

  1. R中字符串操作

    简介 Stringr中包含3个主要的函数族 字符操作 空格处理 模式匹配 常用函数 在平常的数据分析工作中,经常要用到如下的函数 函数 操作 str_length() 获取字符串长度 str_sub( ...

  2. ant中copy操作学习心得(转)

    Ant真是太方便了,以前都没注意到它.功能很强大,能创建数据库,配置服务器,部署发布应用……只需要写好build.xml文件,剩下的就交给ant来“安装”你的WEB应用了. Appfuse的第一个an ...

  3. JavaScript中NODE操作学习总结

    Node: 1.在 HTML DOM (文档对象模型)中,每个部分都是节点:    文档本身是文档节点     所有 HTML 元素是元素节点     所有 HTML 属性是属性节点     HTML ...

  4. R之ddlpy函数学习[转载]

    转自:https://www.cnblogs.com/aloiswei/p/6032513.html 1.函数 ddply(.data, .variables, .fun = NULL, ..., . ...

  5. 碎片︱R语言与深度学习

    笔者:受alphago影响,想看看深度学习,但是其在R语言中的应用包可谓少之又少,更多的是在matlab和python中或者是调用.整理一下目前我看到的R语言的材料: ---------------- ...

  6. R中基本函数学习[转载]

    转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 ...

  7. C#中使用Redis学习二 在.NET4.5中使用redis hash操作

    上一篇>> 摘要 上一篇讲述了安装redis客户端和服务器端,也大体地介绍了一下redis.本篇着重讲解.NET4.0 和 .NET4.5中如何使用redis和C# redis操作哈希表. ...

  8. R语言中的正则表达式(转载:http://blog.csdn.net/duqi_yc/article/details/9817243)

    转载:http://blog.csdn.net/duqi_yc/article/details/9817243 目录 Table of Contents 1 正则表达式简介 2 字符数统计和字符翻译 ...

  9. R 中的哪些命令或者包让你相见恨晚?--转载知乎

    https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Had ...

随机推荐

  1. Material Design系列第六篇——Defining Custom Animations

    Defining Custom Animations //自定义动画 This lesson teaches you to //本节课知识点 Customize Touch Feedback //1. ...

  2. 架设FTP Server-Windows Server 2012

    架设FTP Server-Windows Server 2012 https://jingyan.baidu.com/article/03b2f78c75b9b65ea237ae84.html   在 ...

  3. SharpGL学习笔记(五) 视口变换

    视口变换主是将视景体内投影的物体显示到二维的视口平面上. 在计算机图形学中,它的定义是将经过几何变换, 投影变换和裁剪变换后的物体显示于屏幕指定区域内. 前面我们讨论过的透视投影, 正射投影, 它们都 ...

  4. remote: fatal: could not read Username for 'http://spapa.wicp.net:3000': No such device ors

    解决办法: git remote add origin https://{username}:{password}@github.com/{username}/project.git in my ca ...

  5. 【转】Android四大基本组件介绍与生命周期

    转自:http://www.cnblogs.com/bravestarrhu/archive/2012/05/02/2479461.html Android四大基本组件分别是Activity,Serv ...

  6. 一、laya学习笔记 --- layabox环境搭建 HelloWorld(坑:ts版本问题解决方案)

    好吧,使用layabox需要从官网下载些啥呢 一.下载layabox 官网 https://www.layabox.com/ 首页上有两个,一个Engine,一个IDE Engine我下载的TS版本, ...

  7. mysql概要(四)order by ,limit ,group by和聚合函数的特点,子查询

    1.order by 默认按升序排列(asc/desc),多字段排序 order by 字段 排序方式,字段2 排序方式,..: 在分组排序中,排序是对分组后的结果进行排序,而不是在组中进行排序. s ...

  8. CentOS安装php及其扩展

    列出所有的可安装的软件包 yum list | grep php56w* | grep redis 安装php及其扩展 yum install  -y php56w php56w-mysql php5 ...

  9. Thinkphp框架下设置session的过期时间

    打开项目中的配置文件,添加session的过期配置,如下: 'SESSION_OPTIONS' => array( 'name' => 'BJYSESSION', //设置session名 ...

  10. parameter/argument

    根据网上一些资料,对parameter和argument的区别,做如下的简单说明.1. parameter是指函数定义中参数,而argument指的是函数调用时的实际参数.2. 简略描述为:param ...