Python利用pandas进行数据合并

当使用Python中的pandas库时，merge函数是用于合并（或连接）两个数据框（DataFrame）的重要工具。它类似于SQL中的JOIN操作，允许你根据一个或多个键（key）将两个数据框连接起来。

merge函数的基本语法如下：

pd.merge(

    left,  # 要合并的左侧 DataFrame

    right,  # 要合并的右侧 DataFrame

    how='inner',  # 连接方式，包括 'left', 'right', 'outer', 'inner'，默认为 'inner'

    on=None,  # 用于连接的列名，必须存在于左侧和右侧 DataFrame 中

    left_on=None,  # 左侧 DataFrame 用于连接的列名

    right_on=None,  # 右侧 DataFrame 用于连接的列名

    left_index=False,  # 如果为 True，则使用左侧 DataFrame 的索引作为连接键

    right_index=False,  # 如果为 True，则使用右侧 DataFrame 的索引作为连接键

    suffixes=('_x', '_y'),  # 字符串后缀，用于重叠列名的处理

    sort=False,  # 根据连接键对合并后的数据进行排序

    copy=True,  # 如果为 False，可以提高性能，但是在某些情况下会修改原始数据

)

基本用法

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称'])   # 连接方式，包括 'left', 'right', 'outer', 'inner'，默认为 'inner'

print(merged_df)

指定不同的列名

merged_df = pd.merge(left_df, right_df, how='outer', left_on='店铺名称', right_on='店铺名称2')

print(merged_df)

处理重复列名，相同列名加后缀

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称'], suffixes=('_left', '_right'))

print(merged_df)

根据索引进行合并

merged_df = pd.merge(left_df, right_df, how='outer', left_index=True, right_index=True)

print(merged_df)

开启一列标记列，标记数据来源

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称','订单号'], indicator=True)

print(merged_df)

完整代码

import pandas as pd

# 读取两个 Excel 文件

left_df = pd.read_excel('C:\\Users\\liuchunlin2\\Desktop\\数据1.xlsx',sheet_name='Sheet2')

right_df = pd.read_excel('C:\\Users\\liuchunlin2\\Desktop\\数据2.xlsx',sheet_name='Sheet2')

#基本用法

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称'])   # 连接方式，包括 'left', 'right', 'outer', 'inner'，默认为 'inner'

print(merged_df)

#指定不同的列名

merged_df = pd.merge(left_df, right_df, how='outer', left_on='店铺名称', right_on='店铺名称2')

print(merged_df)

#处理重复列名，相同列名加后缀

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称'], suffixes=('_left', '_right'))

print(merged_df)

#根据索引进行合并

merged_df = pd.merge(left_df, right_df, how='outer', left_index=True, right_index=True)

print(merged_df)

#开启一列标记列，标记数据来源

merged_df = pd.merge(left_df, right_df, how='outer', on=['店铺名称','订单号'], indicator=True)

print(merged_df)

数据一：

数据二：

Python利用pandas进行数据合并的更多相关文章

Python利用pandas处理数据后画图
pandas要处理的数据是一个数据表格.代码: 1 import pandas as pd 2 import numpy as np 3 import matplotlib.pyplot as plt ...
python 利用pandas导入数据
Python利用pandas处理Excel数据的应用
Python利用pandas处理Excel数据的应用最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做 ...
python-数据描述与分析2（利用Pandas处理数据缺失值的处理数据库的使用）
2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后,接下来就是如何处理数据,虽然之前的赋值计算也是一种计算,但是如果Pandas的作用就停留在此,那我们也许只是看到了它的冰山一角,它 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
python利用mongodb上传图片数据 : GridFS 与 bson两种方式
利用mongodb保存图片通常有两种方法,一种是将图片数据转化为二进制作为字典的键值对进行保存,另一种是利用mongodb提供的GridFS进行保存,两者各有利弊.性能方面的优劣未曾测试,无法进行评价 ...
数据分析入门——pandas之数据合并
主要分为:级联:pd.concat.pd.append 合并:pd.merge 一.numpy级联的回顾详细参考numpy章节 https://www.cnblogs.com/jiangbei/p/ ...
pandas 之数据合并
import numpy as np import pandas as pd Data contained in pandas objects can be combined together in ...
Python 利用二分法查询数据
一. 二分法的适用条件二分法查找适用于数据量较大时, 但是数据需要先排好顺序. 优点: 二分法查找效率特别高缺点: 二分法只适用于有序序列二. 二分法的主要思想是:设查找的数组区间为array[ ...
【NumPy】Python利用linspace进行数据采样
情景假设有一堆长度为1000的数据,我现在只想要其中800个并且要求整体趋势一样,那就可以试试使用linspace进行等间距的采样. 简介 linspace(start, stop, num=50, ...

随机推荐

基础版本：用KNN算法实现预测facebook签到位置模型的训练（内含数据集下载）
实现模型的训练一般的流程便是 # 导包 # 导入数据 # 数据处理 # 特征工程 # KNN算法预估流程 # 模型评估接下来便实现以上流程实现该模型训练我们需要导入一下的函数 1 # 导包 2 3 ...
《UNIX 传奇：历史与回忆》读后感
<UNIX 传奇:历史与回忆> 是 bwk(Brian W. Kernighan)2019 年的新作,回忆了 UNIX 在大半个世纪的风雨历程,是一本引人入胜的书籍.通过对 UNIX 操作 ...
[mysql]状态检查常用SQL
前言使用MySQL自身命令获取数据库服务状态. 连接数 -- 最大使用连接数 show status like 'Max_used_connections'; -- 系统配置的最大连接数 show ...
DASCTF 2023 & 0X401七月暑期挑战赛
比赛只出了一道,小菜不是罪过-_- controlflow 这个题动调到底就行 for i in range(40): after_xor[i]=inp[i]^0x401 after_xor[i] + ...
实在智能TARS-RPA-Agent，业界首发的产品级大模型Agent有何非凡之处？
融合LLM的RPA进化到什么程度? AIGC如何借AI Agent落地? 像生成文本一样生成流程的ChatRPA,能够提升RPA新体验? 边探索边创建的ChatRPA,能否破解RPA与LLM融合难题? ...
Elasticsearch之环境搭建
一.安装 elasticsearch -- 拉取镜像 docker pull docker.elastic.co/elasticsearch/elasticsearch:8.9.1 -- 创建 doc ...
gitlab与LDAP 联调
gitlab整理目录 gitlab整理 1.安装Gitlab依赖包 2.下载,安装 3.配置,访问域名及邮箱 4.初始化,启动 5.访问,以及邮箱测试 5.1汉化 6.问题总结处理 6.1安装时出现 ...
分拣平台API安全治理实战 | 京东物流技术团队
导读本文主要基于京东物流的分拣业务平台在生产环境遇到的一些安全类问题,进行定位并采取合适的解决方案进行安全治理,引出对行业内不同业务领域.不同类型系统的安全治理方案的探究,最后笔者也基于自己在金融领 ...
【krpano】 ASP点赞插件
简述这是一个Asp版krpano点赞案例,运用asp+xml读写.存储数据,结合krpano代码实现的功能:现将案例上传网站供大家学习研究,希望对大家有所帮助. 功能用户在网页可点赞后显示已点赞数 ...
MySQL实战实战系列 03 事务隔离：为什么你改了我还看不见？
提到事务,你肯定不陌生,和数据库打交道的时候,我们总是会用到事务.最经典的例子就是转账,你要给朋友小王转 100 块钱,而此时你的银行卡只有 100 块钱. 转账过程具体到程序里会有一系列的操作,比如 ...

Python利用pandas进行数据合并

merge函数的基本语法如下：

基本用法

指定不同的列名

处理重复列名，相同列名加后缀

根据索引进行合并

开启一列标记列，标记数据来源

完整代码

Python利用pandas进行数据合并的更多相关文章

随机推荐

热门专题