DataFrame数据合并
一、join
作用:默认情况下,他是把行索引相同的数据合并到一起
注意:以左为准,没有的部分用NaN补全
例子
import pandas as pd
import numpy as np df1 = pd.DataFrame(data=np.zeros((2, 5)), index=list('AB'), columns=list('VWXYZ'))
# print(df1)
df2 = pd.DataFrame(data=np.ones((3, 4)), index=list('ABC'), columns=list(''))
# print(df2)
df3 = df1.join(df2)
print(df3)
df4 = df2.join(df1)
print(df4)
二、merge
作用:按照指定列把数据按照一定的方式合并到一起
语法
df1.merge(df2, left_on='', right_on='', how='')
left_on: df1的列索引
right_on: df2的列索引
how: 合并方式
inner 交集
outer 并集,NaN补全
left 以左为准,NaN补全
right 以右为准,NaN补全
例子
import pandas as pd
import numpy as np df1 = pd.DataFrame(data=np.ones((3, 4)), index=list('ABC'), columns=list('MNOP'))
df1['O'] = ['a', 'b', 'c']
print(df1) df2 = pd.DataFrame(data=np.zeros((2, 5)), index=list('AB'), columns=list('VWXYZ'))
df2['X'] = ['c', 'd']
print(df2) df3 = df1.merge(df2, left_on='O', right_on='X', how='right')
print(df3)
DataFrame数据合并的更多相关文章
- Pandas中DataFrame数据合并、连接(concat、merge、join)之merge
		二.merge:通过键拼接列 类似于关系型数据库的连接方式,可以根据一个或多个键将不同的DatFrame连接起来. 该函数的典型应用场景是,针对同一个主键存在两张不同字段的表,根据主键整合到一张表里面 ... 
- Pandas中DataFrame数据合并、连接(concat、merge、join)之join
		pandas.DataFrame.join 自己弄了很久,一看官网.感觉自己宛如智障.不要脸了,直接抄 DataFrame.join(other, on=None, how='left', lsuff ... 
- Pandas中DataFrame数据合并、连接(concat、merge、join)之concat
		一.concat:沿着一条轴,将多个对象堆叠到一起 concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, key ... 
- pandas中,dataframe 进行数据合并-pd.concat()
		``# 通过数据框列向(左右)合并 a = pd.DataFrame(X_train) b = pd.DataFrame(y_train) # 合并数据框(合并前需要将数据设置成DataFrame格式 ... 
- python  数据清洗之数据合并、转换、过滤、排序
		前面我们用pandas做了一些基本的操作,接下来进一步了解数据的操作, 数据清洗一直是数据分析中极为重要的一个环节. 数据合并 在pandas中可以通过merge对数据进行合并操作. import n ... 
- pandas学习(数据分组与分组运算、离散化处理、数据合并)
		pandas学习(数据分组与分组运算.离散化处理.数据合并) 目录 数据分组与分组运算 离散化处理 数据合并 数据分组与分组运算 GroupBy技术:实现数据的分组,和分组运算,作用类似于数据透视表 ... 
- python 数据合并
		1. 数据合并 前言 一.横向合并 1. 基本合并语句 2. 键值名不一样的合并 3. “两个数据列名字重复了”的合并 二.纵向堆叠 统计师的Python日记[第6天:数据合并] 前言 根据我的Pyt ... 
- PANDAS 数据合并与重塑(join/merge篇)
		pandas中也常常用到的join 和merge方法 merge pandas的merge方法提供了一种类似于SQL的内存链接操作,官网文档提到它的性能会比其他开源语言的数据操作(例如R)要高效. 和 ... 
- 9-Pandas之数据合并与轴向连接(pd.concat()的详解)
		数据合并:由于数据可能是不同的格式,且来自不同的数据源,为了方便之后的处理与加工,需要将不同的数据转换成一个DataFrame. Numpy中的concatenate().vstack().hstac ... 
随机推荐
- 获取 Nuget 版本号
			本文告诉大家通过命令行获取 Nuget 的版本号 在 Nuget 中没有 -version 和 -v 和 --version 等写法,只需要直接输入 nuget 在第一行就会显示版本号 nuget N ... 
- 不幸的是,我试图在Eclipse中安装Maven 1.5,但出现了以下错误:
			Cannot complete the install because one or more required items could not be found. Software being in ... 
- 【NOIP数据结构专项】单调队列单调栈
			[FZYZ P1280 ][NOIP福建夏令营]矩形覆盖 Description 有N个矩形,矩形的底边边长为1,且均在X轴上,高度给出,第i个矩形的高为h[i],求最少需要几个矩形才能覆盖这个图形. ... 
- FineReport报表和水晶报表的比较
			FineReport报表和水晶报表的比较 FineReport报表软件针对复杂格式的报表数据及Web报表的展现,通过多源分片.不规则分组.双向扩展来轻松拖拽做复杂格式的报表,制作报表从此摆脱了复杂的S ... 
- 阿里云 CentOS8 Repo
			# CentOS-Base.repo # # The mirror system uses the connecting IP address of the client and the # upda ... 
- 不同RAM空间存储变量区分
- redis的事务操作
			事务是一个单独的隔离操作:事务中的所有命令都会序列化.按顺序地执行.事务在执行的过程中,不会被其他客户端发送来的命令请求所打断. 事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行. 一 ... 
- 025.MFC_窗口操作
			窗口操作 一.建立名为dialogOp 的mfc 工程 ,添加9个button 和1个check box组件,并按如图修改caption属性. 最大化窗口 双击最大化button,进入dialogOp ... 
- MySQL性能优化:MySQL中的隐式转换造成的索引失效
			数据库优化是一个任重而道远的任务,想要做优化必须深入理解数据库的各种特性.在开发过程中我们经常会遇到一些原因很简单但造成的后果却很严重的疑难杂症,这类问题往往还不容易定位,排查费时费力最后发现是一个很 ... 
- pyinstaller打包exe文件闪退的解决办法
			pyinstaller是python下目前能打包py文件为windows下的exe文件的一个非常友好易用的库!但是,小爬每次用pyinstaller打包时也总是遇到一些难题,有时网上搜了一圈,也没看到 ... 
