pandas合并/连接

Pandas具有功能全面的高性能内存中连接操作，与SQL等关系数据库非常相似。
Pandas提供了一个单独的merge()函数，作为DataFrame对象之间所有标准数据库连接操作的入口 -

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,

left_index=False, right_index=False, sort=True)

Python

在这里，有以下几个参数可以使用 -

left - 一个DataFrame对象。
right - 另一个DataFrame对象。
on - 列(名称)连接，必须在左和右DataFrame对象中存在(找到)。
left_on - 左侧DataFrame中的列用作键，可以是列名或长度等于DataFrame长度的数组。
right_on - 来自右的DataFrame的列作为键，可以是列名或长度等于DataFrame长度的数组。
left_index - 如果为True，则使用左侧DataFrame中的索引(行标签)作为其连接键。在具有MultiIndex(分层)的DataFrame的情况下，级别的数量必须与来自右DataFrame的连接键的数量相匹配。
right_index - 与右DataFrame的left_index具有相同的用法。
how - 它是left, right, outer以及inner之中的一个，默认为内inner。下面将介绍每种方法的用法。
sort - 按照字典顺序通过连接键对结果DataFrame进行排序。默认为True，设置为False时，在很多情况下大大提高性能。

现在创建两个不同的DataFrame并对其执行合并操作。

合并使用“how”的参数

如何合并参数指定如何确定哪些键将被包含在结果表中。如果组合键没有出现在左侧或右侧表中，则连接表中的值将为NA。

这里是how选项和SQL等效名称的总结 -

合并方法	SQL等效	描述
`left`	`LEFT OUTER JOIN`	使用左侧对象的键
`right`	`RIGHT OUTER JOIN`	使用右侧对象的键
`outer`	`FULL OUTER JOIN`	使用键的联合
`inner`	`INNER JOIN`	使用键的交集

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/5/24 15:03

# @Author  : zhang chao

# @File    : s.py

import pandas as pd

left = pd.DataFrame({

         'id':[1,2,3,4,5],

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5']})

right = pd.DataFrame(

         {'id':[1,2,3,4,5],

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5']})

print (left)

print("========================================")

print (right)

print("========================================")

print("在一个键上合并两个数据帧,how - 它是left, right, outer以及inner之中的一个，默认为内inner为交集")

rs = pd.merge(left,right,on='id')#在一个键上合并两个数据帧,how - 它是left, right, outer以及inner之中的一个，默认为内inner

print(rs)

print("========================================")

print("合并多个键上的两个数据框,默认为交集：")

rs = pd.merge(left,right,on=['id','subject_id'])

print(rs)

print("========================================")

print("使用左侧对象的键：")

rs = pd.merge(left, right, on='subject_id', how='left')

print (rs)

print("========================================")

print("使用键的联合：")

rs = pd.merge(left, right, how='outer', on='subject_id')

print (rs)

print("========================================")

print("使用键的交集：")

rs = pd.merge(left, right, how='inner', on='subject_id')

print (rs)

D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py

     Name  id subject_id

0    Alex   1       sub1

1     Amy   2       sub2

2   Allen   3       sub4

3   Alice   4       sub6

4  Ayoung   5       sub5

========================================

    Name  id subject_id

0  Billy   1       sub2

1  Brian   2       sub4

2   Bran   3       sub3

3  Bryce   4       sub6

4  Betty   5       sub5

========================================

在一个键上合并两个数据帧,how - 它是left, right, outer以及inner之中的一个，默认为内inner为交集

   Name_x  id subject_id_x Name_y subject_id_y

0    Alex   1         sub1  Billy         sub2

1     Amy   2         sub2  Brian         sub4

2   Allen   3         sub4   Bran         sub3

3   Alice   4         sub6  Bryce         sub6

4  Ayoung   5         sub5  Betty         sub5

========================================

合并多个键上的两个数据框,默认为交集：

   Name_x  id subject_id Name_y

0   Alice   4       sub6  Bryce

1  Ayoung   5       sub5  Betty

========================================

使用左侧对象的键：

   Name_x  id_x subject_id Name_y  id_y

0    Alex     1       sub1    NaN   NaN

1     Amy     2       sub2  Billy   1.0

2   Allen     3       sub4  Brian   2.0

3   Alice     4       sub6  Bryce   4.0

4  Ayoung     5       sub5  Betty   5.0

========================================

使用键的联合：

   Name_x  id_x subject_id Name_y  id_y

0    Alex   1.0       sub1    NaN   NaN

1     Amy   2.0       sub2  Billy   1.0

2   Allen   3.0       sub4  Brian   2.0

3   Alice   4.0       sub6  Bryce   4.0

4  Ayoung   5.0       sub5  Betty   5.0

5     NaN   NaN       sub3   Bran   3.0

========================================

使用键的交集：

   Name_x  id_x subject_id Name_y  id_y

0     Amy     2       sub2  Billy     1

1   Allen     3       sub4  Brian     2

2   Alice     4       sub6  Bryce     4

3  Ayoung     5       sub5  Betty     5

Process finished with exit code 0

pandas合并/连接的更多相关文章

SQL连接操作符介绍（循环嵌套, 哈希匹配和合并连接）
今天我将介绍在SQLServer 中的三种连接操作符类型,分别是:循环嵌套.哈希匹配和合并连接.主要对这三种连接的不同.复杂度用范例的形式一一介绍. 本文中使用了示例数据库AdventureWorks ...
排序合并连接(sort merge join)的原理
排序合并连接(sort merge join)的原理排序合并连接(sort merge join)的原理排序合并连接(sort merge join) 访问次数:两张表都只会访 ...
oracle表连接------>排序合并连接(Merge Sort Join)
排序合并连接 (Sort Merge Join)是一种两个表在做连接时用排序操作(Sort)和合并操作(Merge)来得到连接结果集的连接方法. 对于排序合并连接的优缺点及适用场景例如以下: a,通常 ...
oracle 表连接 - sort merge joins 排序合并连接
https://blog.csdn.net/dataminer_2007/article/details/41907581一. sort merge joins连接(排序合并连接) 原理指的是两个表 ...
python pandas合并多个excel(xls和xlsx)文件（弹窗选择文件夹和保存文件）
# python pandas合并多个excel(xls和xlsx)文件(弹窗选择文件夹和保存文件) import tkinter as tk from tkinter import filedial ...
arcgis中的Join(合并连接)和Relate(关联连接)
arcgis中的Join(合并连接)和Relate(关联连接) 一.区别 1.连接关系不一样. Relate(关联连接)方式连接的两个表之间的记录可以是“一对一”.“多对一”.“一对多”的关系 Joi ...
04. Pandas 3| 数值计算与统计、合并连接去重分组透视表文件读取
1.数值计算和统计基础常用数学.统计方法数值计算和统计基础基本参数:axis.skipna df.mean(axis=1,skipna=False) -->> axis=1是按行来 ...
Pandas | 19 合并/连接
Pandas具有功能全面的高性能内存中连接操作,与SQL等关系数据库非常相似.Pandas提供了一个单独的merge()函数,作为DataFrame对象之间所有标准数据库连接操作的入口 - pd.me ...
python pandas 合并数据函数merge join concat combine_first 区分
pandas对象中的数据可以通过一些内置的方法进行合并:pandas.merge,pandas.concat,实例方法join,combine_first,它们的使用对象和效果都是不同的,下面进行区分 ...

随机推荐

vue 实现tab切换动态加载不同的组件
vue 实现tab切换动态加载不同的组件使用vue中的is特性来加载不同的组件.具体看如下代码:这个功能对于vue比较复杂的页面可以使用上,可以把一个页面的功能拆分出来,使代码更简单.使用方式具体看 ...
编写简单Linux内核模块
模块代码如下 //main.c #include <linux/kernel.h> #include <linux/module.h> #include <linux/i ...
centos7搭建kibana
上一节elasticsearch搭建地址 https://www.cnblogs.com/mutong1228/p/10181544.html 学习了上一篇的搭建,理解了命令的含义之后,本节就非常方便 ...
http/2 多路复用技术
虽然 HTTP 1.1 默认启用长TCP连接,但所有的请求-响应都是按序进行的(这里的长连接可理解成半双工协议.即便是HTTP 1.1引入了管道机制,也是如此).复用同一个TCP连接期间,即便是通过管 ...
Java 中数组的内存分配
Java 中数组的内存分配 1.Java 程序在运行时,需要在内存中分配空间.为了提高运算效率,就对空间进行了不同区域的划分,因为每一片区域都有特定的处理数据和内存管理方式. 2.数组基本概念数组是 ...
python运算符基础实例
# encoding=utf-8 #两个数字相加 sumNumber=1+2 print(sumNumber) #输出结果:3 #两个字符串相加 sumString="Nice work&q ...
OSC Source Code Innovation Salon（2018.10.20）
时间:2018.10.20地点:北京朝阳浦项中心B座2层
JavaWeb开发中采用FreeMarker生成Excel表格
最近做了一个需求,要求导出一个采购合同的Excel表格,这个表格样式比较多.由于是合同,这个Excel表格里面有好多格式要求,比如结尾处签字那部分就有格式要求.这里介绍种采用FreeM ...
java 基础02 打包package
HBase最佳实践-管好你的操作系统
本文由网易云发布. 作者:范欣欣本篇文章仅限本站分享,如需转载,请联系网易获取授权. 操作系统这个话题其实很早就想拿出来和大家分享,拖到现在一方面是因为对其中各种理论理解并不十分透彻,怕讲不好: ...

pandas合并/连接

合并使用“how”的参数

pandas合并/连接的更多相关文章

随机推荐

热门专题