9-Pandas之数据合并与轴向连接（pd.concat()的详解）

　　数据合并：由于数据可能是不同的格式，且来自不同的数据源，为了方便之后的处理与加工，需要将不同的数据转换成一个DataFrame。

　　Numpy中的concatenate()、vstack()、hstack()可对数组进行拼接，可参考学习。

　　Pandas提供了pd.concat()、pd.merge()、join()、combine_first()等函数对Pandas数据对象进行合并。

在本节中，仅对pd.concat()进行详细讲解。

pd.concat()常用的参数
参数	说明
objs	需连接的对象的列表
axis	轴向连接所沿的轴，默认为0
ignore_index	默认False，当为True时表示不适用连接轴上的索引值，生成的轴标记为0...n-1
keys	序列，默认为None。构建层次化索引，且该索引位于最外层
join	值为'inner'或'outer'（默认'outer'）。指定处理其他轴上的索引（并集或交集）
join_axes	指定其他轴上的索引，不执行并集或交集运算

（1）默认连接两个DataFrame对象（默认axis = 0，即上下连接）

>>> import pandas as pd

>>> df1 = pd.DataFrame({'姓名':['钱某','段某'],'年龄':[20,24]},index=[2,3])

>>> df2 = pd.DataFrame({'姓名':['钱某','段某'],'年龄':[20,24]},index=[2,3])

>>> df1

   姓名  年龄

2  钱某  20

3  段某  24

>>> df2

   姓名  年龄

2  钱某  20

3  段某  24

#连接两个对象

>>> pd.concat([df1,df2])

   姓名  年龄

2  钱某  20

3  段某  24

2  钱某  20

3  段某  24

（2）左右连接两个DataFrame对象

>>> df1 = pd.DataFrame({'年龄':[22,26],'籍贯':['北京','河北']},index=['张某','李某'])

>>> df2 = pd.DataFrame({'身高':[175,180],'体重':[70,85]},index=['张某','李某'])

>>> df1

    年龄  籍贯

张某  22  北京

李某  26  河北

>>> df2

     身高  体重

张某  175  70

李某  180  85

#左右连接

>>> pd.concat([df1,df2],axis=1)

    年龄  籍贯   身高  体重

张某  22  北京  175  70

李某  26  河北  180  85

（3）验证ignore_index参数，即将连接后的列名转化为0...n-1

>>> pd.concat([df1,df2],axis=1,ignore_index=True)

     0   1    2   3

张某  22  北京  175  70

李某  26  河北  180  85

（4）验证keys参数，即构建层次化索引

>>> pd.concat([df1,df2],axis=1,keys=['df1','df2'])

   df1      df2

    年龄  籍贯   身高  体重

张某  22  北京  175  70

李某  26  河北  180  85

（5）验证join参数，默认 join = 'outer' ，取并集，不会造成信息的缺失

>>> df3 = pd.DataFrame({'身高':[175,183],'体重':[70,87]},index=['张某','钱某'])

>>> df3

     身高  体重

张某  175  70

钱某  183  87

#取并集

>>> pd.concat([df1,df3],axis=1)

      年龄   籍贯     身高    体重

张某  22.0   北京  175.0  70.0

李某  26.0   河北    NaN   NaN

钱某   NaN  NaN  183.0  87.0

#取交集

>>> pd.concat([df1,df3],axis=1,join='inner')

    年龄  籍贯   身高  体重

张某  22  北京  175  70

（6）验证join_axes参数，若只想重用原始DataFrame中的索引，则项 join_axes 传入一个索引对象列表

>>> pd.concat([df1,df3],axis=1)

      年龄   籍贯     身高    体重

张某  22.0   北京  175.0  70.0

李某  26.0   河北    NaN   NaN

钱某   NaN  NaN  183.0  87.0

>>> pd.concat([df1,df3],axis=1,join_axes=[df1.index])

    年龄  籍贯     身高    体重

张某  22  北京  175.0  70.0

李某  26  河北    NaN   NaN

9-Pandas之数据合并与轴向连接（pd.concat()的详解）的更多相关文章

给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤（图文详解）
这个很简单,在集群机器里,选择就是了,本来自带就有Impala的. 扩展博客给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)
给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤（图文详解）
不多说,直接上干货! Impala和Hive的关系(详解) 扩展博客给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 参考 horton ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
数据分析入门——pandas之数据合并
主要分为:级联:pd.concat.pd.append 合并:pd.merge 一.numpy级联的回顾详细参考numpy章节 https://www.cnblogs.com/jiangbei/p/ ...
pandas 之数据合并
import numpy as np import pandas as pd Data contained in pandas objects can be combined together in ...
Echarts数据可视化grid直角坐标系（xAxis、yAxis）详解：
mytextStyle={ color:"#333", //文字颜色 fontStyle:"normal", //italic斜体 oblique倾斜 font ...
【大数据】Linux下安装Hadoop(2.7.1)详解及WordCount运行
一.引言在完成了Storm的环境配置之后,想着鼓捣一下Hadoop的安装,网上面的教程好多,但是没有一个特别切合的,所以在安装的过程中还是遇到了很多的麻烦,并且最后不断的查阅资料,终于解决了问题,感 ...
Pandas 时间序列数据绘制X轴主要刻度和次要刻度
先上效果图吧(图中Tue表示周二): Pandas和matplotlib.dates都是使用matplotlib.units来定位刻度. matplotlib.dates可以方便的手动设置刻度,同时p ...
Linq 数据合并，比较，连接，交叉维恩图工具
Except 返回包含两个不同之处的linq结果集 Intersect 返回两个容器中共同的数据项 Union 返回所有成员,相同的成员出现多次,将只返回一个 Concat 返回所有数据项

随机推荐

Python数据结构（二）
array固定类型的数据序列,与list类似,只不过成员必须是相同的基本类型 array.typecodes #包含所有可用类型代码的字符串bBuhHiIlLqQfd 输入代码 C型 Python类型 ...
Python3笔记010 - 3.1 程序结构
第3章流程控制语句 3.1 程序结构程序设计的基本结构: 顺序结构---顺序执行所有语句选择结构---选择执行部分语句循环结构---循环执行部分语句 1.顺序结构按照顺序执行语句. 2.选择 ...
（私人收藏）精美PPT模板
精美PPT模板 https://pan.baidu.com/s/1vsRnX5h7t3MZ7qdrFvuI1wsucr
h5移动端实现图片文件上传
PC端上传文件多半用插件,引入flash都没关系,但是移动端要是还用各种冗余的插件估计得被喷死,项目里面需要做图片上传的功能,既然H5已经有相关的接口且兼容性良好,当然优先考虑用H5来实现. JS代码 ...
MySQL 事务异常事务隔离的级别
MySQL 事务异常事务隔离的级别事务在你操作数据库的同时,有可能其他用户还会不断地对数据进行增删改查操作.为了避免并行进行时出现混乱,就产生了"事务".事务就是要保证 ...
HBase写入异常RejectedExecutionException
HBase在大数据量并发写入时,写一段时间后HBase监控界面出现告警,写入程序日志里频繁出现异常java.util.concurrent.RejectedExecutionException: 从异 ...
Django---进阶7
目录图书管理的图书增删改查 choices参数(数据库字段设计常见) MTV与MVC模型多对多三种创建方式 Ajax 小例子作业图书管理的图书增删改查 from django.shortcut ...
用Kubernetes部署Springboot或Nginx，也就一个文件的事
1 前言经过<Maven一键部署Springboot到Docker仓库,为自动化做准备>,Springboot的Docker镜像已经准备好,也能在Docker上成功运行了,是时候放上Ku ...
day11 文件操作（上）
目录一.什么是文件二.为何要用文件三.如何使用文件 3.1文件操作的基本流程 3.2资源回收with上下文管理 3.3指定操作文本的字符编码四.文件的操作模式 4.1控制文件读写操作的模式(t ...
vue + echart 实现中国地图和省市地图（可切换省份）
一.中国地图 1.先导入echarts,然后再main.js里引入echarts // 引入echartsimport echarts from 'echarts'Vue.prototype.$ech ...

9-Pandas之数据合并与轴向连接（pd.concat()的详解）

9-Pandas之数据合并与轴向连接（pd.concat()的详解）的更多相关文章

随机推荐

热门专题