Pandas级联

Pandas提供了各种工具(功能)，可以轻松地将Series，DataFrame和Panel对象组合在一起。

pd.concat(objs,axis=0,join='outer',join_axes=None,

ignore_index=False)

Python

其中，

objs - 这是Series，DataFrame或Panel对象的序列或映射。
axis - {0，1，...}，默认为0，这是连接的轴。
join - {'inner', 'outer'}，默认inner。如何处理其他轴上的索引。联合的外部和交叉的内部。
ignore_index − 布尔值，默认为False。如果指定为True，则不要使用连接轴上的索引值。结果轴将被标记为：0，...，n-1。
join_axes - 这是Index对象的列表。用于其他(n-1)轴的特定索引，而不是执行内部/外部集逻辑。

连接对象

concat()函数完成了沿轴执行级联操作的所有重要工作。下面代码中，创建不同的对象并进行连接。

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = pd.concat([one,two])

print(rs)

Python

执行上面示例代码，得到以下结果 -

   Marks_scored    Name subject_id

1            98    Alex       sub1

2            90     Amy       sub2

3            87   Allen       sub4

4            69   Alice       sub6

5            78  Ayoung       sub5

1            89   Billy       sub2

2            80   Brian       sub4

3            79    Bran       sub3

4            97   Bryce       sub6

5            88   Betty       sub5

Shell

假设想把特定的键与每个碎片的DataFrame关联起来。可以通过使用键参数来实现这一点 -

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = pd.concat([one,two],keys=['x','y'])

print(rs)

Python

执行上面示例代码，得到以下结果 -

     Marks_scored    Name subject_id

x 1            98    Alex       sub1

  2            90     Amy       sub2

  3            87   Allen       sub4

  4            69   Alice       sub6

  5            78  Ayoung       sub5

y 1            89   Billy       sub2

  2            80   Brian       sub4

  3            79    Bran       sub3

  4            97   Bryce       sub6

  5            88   Betty       sub5

Shell

结果的索引是重复的; 每个索引重复。如果想要生成的对象必须遵循自己的索引，请将ignore_index设置为True。参考以下示例代码 -

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = pd.concat([one,two],keys=['x','y'],ignore_index=True)

print(rs)

Python

执行上面示例代码，得到以下结果 -

   Marks_scored    Name subject_id

0            98    Alex       sub1

1            90     Amy       sub2

2            87   Allen       sub4

3            69   Alice       sub6

4            78  Ayoung       sub5

5            89   Billy       sub2

6            80   Brian       sub4

7            79    Bran       sub3

8            97   Bryce       sub6

9            88   Betty       sub5

Shell

观察，索引完全改变，键也被覆盖。如果需要沿axis=1添加两个对象，则会添加新列。

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = pd.concat([one,two],axis=1)

print(rs)

Python

执行上面示例代码，得到以下结果 -

   Marks_scored    Name subject_id  Marks_scored   Name subject_id

1            98    Alex       sub1            89  Billy       sub2

2            90     Amy       sub2            80  Brian       sub4

3            87   Allen       sub4            79   Bran       sub3

4            69   Alice       sub6            97  Bryce       sub6

5            78  Ayoung       sub5            88  Betty       sub5

Shell

使用附加连接

连接的一个有用的快捷方式是在Series和DataFrame实例的append方法。这些方法实际上早于concat()方法。它们沿axis=0连接，即索引 -

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = one.append(two)

print(rs)

Python

执行上面示例代码，得到以下结果 -

   Marks_scored    Name subject_id

1            98    Alex       sub1

2            90     Amy       sub2

3            87   Allen       sub4

4            69   Alice       sub6

5            78  Ayoung       sub5

1            89   Billy       sub2

2            80   Brian       sub4

3            79    Bran       sub3

4            97   Bryce       sub6

5            88   Betty       sub5

Shell

append()函数也可以带多个对象 -

import pandas as pd

one = pd.DataFrame({

         'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],

         'subject_id':['sub1','sub2','sub4','sub6','sub5'],

         'Marks_scored':[98,90,87,69,78]},

         index=[1,2,3,4,5])

two = pd.DataFrame({

         'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],

         'subject_id':['sub2','sub4','sub3','sub6','sub5'],

         'Marks_scored':[89,80,79,97,88]},

         index=[1,2,3,4,5])

rs = one.append([two,one,two])

print(rs)

Python

执行上面示例代码，得到以下结果 -

   Marks_scored    Name subject_id

1            98    Alex       sub1

2            90     Amy       sub2

3            87   Allen       sub4

4            69   Alice       sub6

5            78  Ayoung       sub5

1            89   Billy       sub2

2            80   Brian       sub4

3            79    Bran       sub3

4            97   Bryce       sub6

5            88   Betty       sub5

1            98    Alex       sub1

2            90     Amy       sub2

3            87   Allen       sub4

4            69   Alice       sub6

5            78  Ayoung       sub5

1            89   Billy       sub2

2            80   Brian       sub4

3            79    Bran       sub3

4            97   Bryce       sub6

5            88   Betty       sub5

Shell

时间序列

Pandas为时间序列数据的工作时间提供了一个强大的工具，尤其是在金融领域。在处理时间序列数据时，我们经常遇到以下情况 -

生成时间序列
将时间序列转换为不同的频率

Pandas提供了一个相对紧凑和自包含的工具来执行上述任务。

获取当前时间

datetime.now()用于获取当前的日期和时间。

import pandas as pd

print pd.datetime.now()

Python

上述代码执行结果如下 -

2017-11-03 02:17:45.997992

Shell

创建一个时间戳

时间戳数据是时间序列数据的最基本类型，它将数值与时间点相关联。对于Pandas对象来说，意味着使用时间点。举个例子 -

import pandas as pd

time = pd.Timestamp('2018-11-01')

print(time)

Python

执行上面示例代码，得到以下结果 -

2018-11-01 00:00:00

Shell

也可以转换整数或浮动时期。这些的默认单位是纳秒(因为这些是如何存储时间戳的)。然而，时代往往存储在另一个可以指定的单元中。再举一个例子 -

import pandas as pd

time = pd.Timestamp(1588686880,unit='s')

print(time)

Python

执行上面示例代码，得到以下结果 -

2020-05-05 13:54:40

Shell

创建一个时间范围

import pandas as pd

time = pd.date_range("12:00", "23:59", freq="30min").time

print(time)

Python

执行上面示例代码，得到以下结果 -

[datetime.time(12, 0) datetime.time(12, 30) datetime.time(13, 0)

 datetime.time(13, 30) datetime.time(14, 0) datetime.time(14, 30)

 datetime.time(15, 0) datetime.time(15, 30) datetime.time(16, 0)

 datetime.time(16, 30) datetime.time(17, 0) datetime.time(17, 30)

 datetime.time(18, 0) datetime.time(18, 30) datetime.time(19, 0)

 datetime.time(19, 30) datetime.time(20, 0) datetime.time(20, 30)

 datetime.time(21, 0) datetime.time(21, 30) datetime.time(22, 0)

 datetime.time(22, 30) datetime.time(23, 0) datetime.time(23, 30)]

Shell

改变时间的频率

import pandas as pd

time = pd.date_range("12:00", "23:59", freq="H").time

print(time)

Python

执行上面示例代码，得到以下结果 -

[datetime.time(12, 0) datetime.time(13, 0) datetime.time(14, 0)

 datetime.time(15, 0) datetime.time(16, 0) datetime.time(17, 0)

 datetime.time(18, 0) datetime.time(19, 0) datetime.time(20, 0)

 datetime.time(21, 0) datetime.time(22, 0) datetime.time(23, 0)]

Shell

转换为时间戳

要转换类似日期的对象(例如字符串，时代或混合)的序列或类似列表的对象，可以使用to_datetime函数。当传递时将返回一个Series(具有相同的索引)，而类似列表被转换为DatetimeIndex。看看下面的例子 -

import pandas as pd

time = pd.to_datetime(pd.Series(['Jul 31, 2009','2019-10-10', None]))

print(time)

Python

执行上面示例代码，得到以下结果 -

0   2009-07-31

1   2019-10-10

2          NaT

dtype: datetime64[ns]

Shell

NaT表示不是一个时间的值(相当于NaN)

举一个例子，

import pandas as pd

import pandas as pd

time = pd.to_datetime(['2009/11/23', '2019.12.31', None])

print(time)

Python

执行上面示例代码，得到以下结果 -

DatetimeIndex(['2009-11-23', '2019-12-31', 'NaT'], dtype='datetime64[ns]', freq=None)

Pandas级联的更多相关文章

pandas 级联 concat append
连接的一个有用的快捷方式是在Series和DataFrame实例的append方法.这些方法实际上早于concat()方法. 它们沿axis=0连接 #encoding:utf8 import pan ...
Pandas教程目录
Pandas数据结构 Pandas系列 Pandas数据帧(DataFrame) Pandas面板(Panel) Pandas基本功能 Pandas描述性统计 Pandas函数应用 Pandas重建索 ...
Numpy Pandas
数据分析 : 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律. 数据分析三剑客 - Numpy Pandas Matplotlib # Numpy 基于一维或多维的数 ...
Pandas | 20 级联
Pandas提供了各种工具(功能),可以轻松地将Series,DataFrame和Panel对象组合在一起. pd.concat(objs,axis=0,join='outer',join_axes= ...
数据分析03 /基于pandas的数据清洗、级联、合并
数据分析03 /基于pandas的数据清洗.级联.合并目录数据分析03 /基于pandas的数据清洗.级联.合并 1. 处理丢失的数据 2. pandas处理空值操作 3. 数据清洗案例 4. 处 ...
pandas的级联操作
级联操作 pd.concat, pd.append import pandas as pd from pandas import DataFrame import numpy as np pandas ...
第十五节：pandas之concat（）级联
Pandas 提供了concat()函数可以轻松的将Series.DataFrame对象进行合并在一起. pandas.concat(obj , axis=0 , join="inner&q ...
第三节 pandas续集
import pandas as pd from pandas import Series from pandas import DataFrame import numpy as np 一创建多层 ...
数据分析之Pandas
一.Pandas介绍 1.介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. ...

随机推荐

oninput事件(解决onkeyup无法监听到复制黏贴)
change事件需要两个条件触发: a)当前对象属性改变,并且是由键盘或鼠标事件激发的(脚本触发无效) b)当前对象失去焦点(onblur) keypress 能监听键盘事件,但鼠标复制黏贴操作就 ...
linux运维 vi vim q 的间接注释
w q --不发生写的写,无增删效果. 点q后,再次执行 vi /var/www/share/w.php 仍然会‘ Found a swap file by the name "/var/ ...
C#生成Windows服务
1. 新建一个项目,或者从选择当前解决方案--右键-添加--新建项目 2. 选择Visual C#项目-->Windows 服务,填写要创建的服务名称(修改默认的WindowService1成为 ...
Hibernate 中一对多和多对多映射
1. 一对多映射 1.1 JavaWeb 一对多建表原则多方表的外键指向一方表的主键; 1.2 编写一对多的 JavaBean // 客户(一方)和联系人(多方) // 客户(一方) JavaBea ...
MongoDB资料汇总（转）
原文:MongoDB资料汇总上一篇Redis资料汇总专题很受大家欢迎,这里将MongoDB的系列资料也进行了简单整理.希望能对大家有用. 最后更新时间:2013-04-22 1.MongoDB是什么 ...
Selenium定位不到指定元素原因之iframe（unable to locate element）
浏览过程中,图片中的内容可能太小,无法看清,可以>右键>在新标签中打开 Outline 项目原因,需要用selenium实现模拟登陆.模拟上传文件,自然就需要模拟点击[上传]按钮: 模拟点 ...
Python中的不同进制的语法和转换
不同进制的书写方式八进制(Octal) 0o377 十六进制(Hex) 0xFF 二进制(Binary) 0b11111111 不同进制之间的转换 python提供了三个内置的函数,能够用来在不同进 ...
Selenium 安装与卸载
安装: 在cmd中键入pip install selenium==3.6.0(等号后面的为版本号),并点击回车,当出现Successfully installed selenium-3.6.0即表示已 ...
python逆向工程：通过代码生成类图
python逆向工程:通过代码生成类图大致过程现在有一个core包,里面有python的代码. 通过core包,生成python的类图,如下: 实施步骤: 1.首先安装graphviz,一个画图工 ...
Linux学习笔记（12）linux文件目录与用户管理
基本常用目录 1.文件及目录 1.1.文件/文件夹权限用法: (1) chgrp group_name dir_name/file_name, (2) chown user_name:g ...

Pandas级联

连接对象

使用附加连接

时间序列

获取当前时间

创建一个时间戳

创建一个时间范围

改变时间的频率

转换为时间戳

Pandas级联的更多相关文章

随机推荐

热门专题