Pandas学习笔记系列：

原文：https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/3-6-pd-concat/ 本文有删改

Concat

pandas处理多组数据的时候往往会要用到数据的合并处理,使用 concat是一种基本的合并方式.而且concat中有很多参数可以调整,合并成你想要的数据形式.

axis (合并方向)

axis=0是预设值，因此未设定任何参数时，函数默认axis=0。

import pandas as pd

import numpy as np

#定义资料集

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((3,4))*2, columns=['a','b','c','d'])

#concat纵向合并

res = pd.concat([df1, df2, df3], axis=0)

#打印结果

print(res)

"""

    a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

0  1.0  1.0  1.0  1.0

1  1.0  1.0  1.0  1.0

2  1.0  1.0  1.0  1.0

0  2.0  2.0  2.0  2.0

1  2.0  2.0  2.0  2.0

2  2.0  2.0  2.0  2.0

"""

仔细观察会发现结果的index是0, 1, 2, 0, 1, 2, 0, 1, 2，若要将index重置，请看下面。

ignore_index (重置 index)

#承上一个例子，并将index_ignore设定为True

res = pd.concat([df1, df2, df3], axis=0, ignore_index=True)

#打印结果

print(res)

"""

    a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

6  2.0  2.0  2.0  2.0

7  2.0  2.0  2.0  2.0

8  2.0  2.0  2.0  2.0

"""

结果的index变0, 1, 2, 3, 4, 5, 6, 7, 8。

join (合并方式)

join='outer'为预设值，因此未设定任何参数时，函数默认join='outer'。此方式是依照column来做纵向合并，有相同的column上下合并在一起，其他独自的column个自成列，原本没有值的位置皆以NaN填充。

import pandas as pd

import numpy as np

#定义资料集

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'], index=[1,2,3])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['b','c','d','e'], index=[2,3,4])

#纵向"外"合并df1与df2

res = pd.concat([df1, df2], axis=0, join='outer')

print(res)

"""

    a    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN

2  0.0  0.0  0.0  0.0  NaN

3  0.0  0.0  0.0  0.0  NaN

2  NaN  1.0  1.0  1.0  1.0

3  NaN  1.0  1.0  1.0  1.0

4  NaN  1.0  1.0  1.0  1.0

"""

原理同上个例子的说明，但只有相同的column合并在一起，其他的会被抛弃。

#承上一个例子

#纵向"内"合并df1与df2

res = pd.concat([df1, df2], axis=0, join='inner')

#打印结果

print(res)

"""

    b    c    d

1  0.0  0.0  0.0

2  0.0  0.0  0.0

3  0.0  0.0  0.0

2  1.0  1.0  1.0

3  1.0  1.0  1.0

4  1.0  1.0  1.0

"""

#重置index并打印结果

res = pd.concat([df1, df2], axis=0, join='inner', ignore_index=True)

print(res)

"""

    b    c    d

0  0.0  0.0  0.0

1  0.0  0.0  0.0

2  0.0  0.0  0.0

3  1.0  1.0  1.0

4  1.0  1.0  1.0

5  1.0  1.0  1.0

"""

join_axes (依照 axes 合并)

import pandas as pd

import numpy as np

#定义资料集

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'], index=[1,2,3])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['b','c','d','e'], index=[2,3,4])

#依照`df1.index`进行横向合并

res = pd.concat([df1, df2], axis=1, join_axes=[df1.index])

#打印结果

print(res)

"""

    a    b    c    d    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN  NaN  NaN  NaN

2  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

3  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

"""

#移除join_axes，并打印结果

res = pd.concat([df1, df2], axis=1)

print(res)

"""

    a    b    c    d    b    c    d    e

1  0.0  0.0  0.0  0.0  NaN  NaN  NaN  NaN

2  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

3  0.0  0.0  0.0  0.0  1.0  1.0  1.0  1.0

4  NaN  NaN  NaN  NaN  1.0  1.0  1.0  1.0

"""

append (添加数据)

append只有纵向合并，没有横向合并。

import pandas as pd

import numpy as np

#定义资料集

df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])

df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

df3 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])

s1 = pd.Series([1,2,3,4], index=['a','b','c','d'])

#将df2合并到df1的下面，以及重置index，并打印出结果

res = df1.append(df2, ignore_index=True)

print(res)

"""

    a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

"""

#合并多个df，将df2与df3合并至df1的下面，以及重置index，并打印出结果

res = df1.append([df2, df3], ignore_index=True)

print(res)

"""

    a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  1.0  1.0  1.0

4  1.0  1.0  1.0  1.0

5  1.0  1.0  1.0  1.0

6  1.0  1.0  1.0  1.0

7  1.0  1.0  1.0  1.0

8  1.0  1.0  1.0  1.0

"""

#合并series，将s1合并至df1，以及重置index，并打印出结果

res = df1.append(s1, ignore_index=True)

print(res)

"""

    a    b    c    d

0  0.0  0.0  0.0  0.0

1  0.0  0.0  0.0  0.0

2  0.0  0.0  0.0  0.0

3  1.0  2.0  3.0  4.0

"""

【转】Pandas学习笔记（五）合并 concat的更多相关文章

【转】Pandas学习笔记（六）合并 merge
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
【转】Pandas学习笔记（七）plot画图
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
【转】Pandas学习笔记（四）处理丢失值
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
【转】Pandas学习笔记（三）修改&添加值
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
【转】Pandas学习笔记（二）选择数据
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
【转】Pandas学习笔记（一）基本介绍
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
C#可扩展编程之MEF学习笔记(五)：MEF高级进阶
好久没有写博客了,今天抽空继续写MEF系列的文章.有园友提出这种系列的文章要做个目录,看起来方便,所以就抽空做了一个,放到每篇文章的最后. 前面四篇讲了MEF的基础知识,学完了前四篇,MEF中比较常用 ...
（转）Qt Model/View 学习笔记 (五)——View 类
Qt Model/View 学习笔记 (五) View 类概念在model/view架构中,view从model中获得数据项然后显示给用户.数据显示的方式不必与model提供的表示方式相同,可以与 ...
java之jvm学习笔记五(实践写自己的类装载器)
java之jvm学习笔记五(实践写自己的类装载器) 课程源码:http://download.csdn.net/detail/yfqnihao/4866501 前面第三和第四节我们一直在强调一句话,类 ...

随机推荐

MySQL实战45讲学习笔记：第二十三讲
一.本节概要今天这篇文章,我会继续和你介绍在业务高峰期临时提升性能的方法.从文章标题“MySQL 是怎么保证数据不丢的?”,你就可以看出来,今天我和你介绍的方法,跟数据的可靠性有关. 在专栏前面文章 ...
python总结十一
1.python运行速度慢的原因: python不是强类型的语言,所以解释器运行时遇到变量以及数据类型转换,比较操作,引用变量时都需要检查其数据类型 python的编译器启动速度比java快,但几乎每 ...
19条常用的MySQL优化方法（转）
本文我们来谈谈项目中常用的MySQL优化方法,共19条,具体如下:1.EXPLAIN命令做MySQL优化,我们要善用EXPLAIN查看SQL执行计划.下面来个简单的示例,标注(1.2.3.4.5)我们 ...
关于stm32f10x_conf.h文件
简介 stm32f10x_conf.h文件有2个作用:①提供对assert_param运行时参数检查宏函数的定义.②将开发者用到的标准外设头文件集中在这个文件里面,而stm32f10x_conf.h又 ...
JS中Map的用法
声明 var map = new Map(); 设值 map.set("key","value"); 取值 map.get("key"); ...
Redis（一） redis安装、启停
Redis是开源的内存数据存储,常被用作为内存数据库.缓存.全局队列.计数器等等. Redis安装 Redis分为多种模式:单机模式.高可用模式.集群模式.这篇中主要简介单机版的安装方式. 源码构建式 ...
StringBuilder删除最后的字符
stringbuilder碰到拼接XXx:XXX:这样的字符的时候,往往需要删除最后一个字符,通过remove(起始索引,向右移除的个数)可以实现. StringBuilder sb = new St ...
dotnet + LinQ 按照指定的字段和排序方式排序
/// <summary> /// 根据指定属性名称对序列进行排序 /// </summary> /// <typeparam name="TSource&qu ...
安卓访问https错误，访问http可以，可能是nginx ssl证书配置有问题
开发中遇到react-native生成的android访问UAT和开发环境的http api都可以,但是访问生产环境的https就报错,还有就是第三方webhook调用你https网站的api也可能会 ...
检测代码潜在bug和质量之SonarQube
参数使用项目分析参数可以在多个地方设置,继承关系如下: 全局分析参数,通过Web UI设置,作用于所有项目(配置–>通用–>通用中设置) 项目分析参数,通过WebUI设置,覆盖全局参数( ...

【转】Pandas学习笔记（五）合并 concat