Pandas使用实用技巧
Pandas实用使用技巧
1 列拆分成行
常见的需求是将某一列根据指定的分隔符拆分成多列。现有需求,根据指定的分隔符将其拆分为多行。
例:
df = A B
0 a f
1 b;c h;g
2 d k
3 e l
现需要将其拆分为:
df = A B
0 a f
1 b h
1 c g
2 d k
3 e l
1.1 处理A列
实现过程如下:
df = pd.DataFrame({'A': ['a', 'b;c', 'd', 'e'], 'B': ['f', 'h;j', 'k', 'l']})
df
A B
0 a f
1 b;c h;j
2 d k
3 e l
将A列按照“;”分割,并展开为DataFrame,该效果由expand参数空值:
df_a = df['A'].str.split(';', expand=True)
df_a
0 1
0 a None
1 b c
2 d None
3 e None
将df_a进行堆积:
df_a = df_a.stack()
df_a 0 0 a
1 0 b
1 c
2 0 d
3 0 e
dtype: object
将内层索引重置为列并删除掉:
df_a = df_a.reset_index(level=1, drop=True)
df_a 0 a
1 b
1 c
2 d
3 e
dtype: object
重命名该Series,否则接下来合并会失败:
df_a.rename('A_split', inplace=True)
df_a
0 a
1 b
1 c
2 d
3 e
Name: A_split, dtype: object
1.2 处理列B
处理过程同列A,最后重命名后为:
df_b.rename('B_split', inplace=True)
df_b
0 f
1 h
1 j
2 k
3 l
Name: B_split, dtype: object
1.3 合并A_split和B_split
水平合并处理完成后的两列:
concat_a_b = pd.concat([df_a, df_b], axis=1)
concat_a_b
A_split B_split
0 a f
1 b h
1 c j
2 d k
3 e l
1.4 最后和原数据合并
将最终处理的数据和原数据根据索引进行合并:
df = df.join(concat_a_b, how='inner')
df A B A_split B_split
0 a f a f
1 b;c h;j b h
1 b;c h;j c j
2 d k d k
3 e l e l
最后达到了想要的效果。
2 切片插入多行
常见的需求是在指定的位置插入一行或者一列。现有需求,在指定的位置插入多行或者多列:
df = pd.DataFrame({'Name': ['Tom', 'Jack', 'Steve', 'Ricky'], 'Age': [28,34,29,42]})
df
Out[4]:
Name Age
0 Tom 28
1 Jack 34
2 Steve 29
3 Ricky 42
df1 = pd.DataFrame({'Name':['Anna', 'Susie'],'Age':[20,50]})
df1
Out[6]:
Name Age
0 Anna 20
1 Susie 50
df2 = pd.DataFrame({'Name':['Anna', 'Susie', 'Jhone'],'Age':[20, 50, 35]})
df2
Out[10]:
Name Age
0 Anna 20
1 Susie 50
2 Jhone 35
2.1 将df1作为整体插入索引2的位置
通过numpy的insert方法实现数组重构,然后再将数组构造成需要的表格:
np.insert(df.values, 2, df1.values, axis=0)
Out[7]:
array([['Tom', 28],
['Jack', 34],
['Anna', 20],
['Susie', 50],
['Steve', 29],
['Ricky', 42]], dtype=object)
可以观察到数据被插入到df索引2的位置。可以根据原来的列名直接构造DataFrame来实现需求:
pd.DataFrame(np.insert(df.values, 2, df1.values, axis=0), columns=df.columns)
Out[8]:
Name Age
0 Tom 28
1 Jack 34
2 Anna 20
3 Susie 50
4 Steve 29
5 Ricky 42
2.2 将df2每一行分开插入到指定位置
通过numpy的insert方法实现数组重构,然后再将数组构造成需要的表格:
np.insert(df.values, (0, 1, 2), df2.values, axis=0)
Out[12]:
array([['Anna', 20],
['Tom', 28],
['Susie', 50],
['Jack', 34],
['Jhone', 35],
['Steve', 29],
['Ricky', 42]], dtype=object)
可以观察到数据被插入到df索引0、1、2的位置。可以根据原来的列名直接构造DataFrame来实现需求:
pd.DataFrame(np.insert(df.values, (0, 1, 2), df2.values, axis=0), columns=df.columns)
Out[13]:
Name Age
0 Anna 20
1 Tom 28
2 Susie 50
3 Jack 34
4 Jhone 35
5 Steve 29
6 Ricky 42
Pandas使用实用技巧的更多相关文章
- Notepad++ 实用技巧
Notepad++是一款开源的文本编辑器,功能强大.很适合用于编辑.注释代码.它支持绝大部分主流的编程语言. 本文主要列举了本人在实际使用中遇到的一些技巧. 快捷键 自定义快捷键 首先,需要知道的是: ...
- javascript实用技巧、javascript高级技巧
字号+作者:H5之家 来源:H5之家 2016-10-31 11:00 我要评论( ) 三零网提供网络编程. JavaScript 的技术文章javascript实用技巧.javascript高级技巧 ...
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式 说明: 1)该文简短介绍在iOS开发中遍历字典.数组和集合的几种常见方式. 2)该文对应的代码可以在下面的地址获得:https:// ...
- iOS开发实用技巧—在手机浏览器头部弹出app应用下载提示
iOS开发实用技巧—在手机浏览器头部弹出app应用下载提示 本文介绍其简单使用: 第一步:在本地建立一个访问的服务端. 打开本地终端,在本地新建一个文件夹,在该文件夹中存放测试的html页面. ...
- iOS开发实用技巧—项目新特性页面的处理
iOS开发实用技巧篇—项目新特性页面的处理 说明:本文主要说明在项目开发中会涉及到的最最简单的新特性界面(实用UIScrollView展示多张图片的轮播)的处理. 代码示例: 新建一个专门的处理新特性 ...
- IOS 网络浅析-(十三 SDWebImage 实用技巧)
IOS 网络浅析-(十三 SDWebImage 实用技巧) 首先让我描述一下为了什么而产生的实用技巧.(在TableView.CollectionView中)当用户所处环境WiFi网速不够快(不能立即 ...
- NSString的八条实用技巧
NSString的八条实用技巧 有一篇文章写了:iOS开发之NSString的几条实用技巧 , 今天这篇,我们讲讲NSString的八条实用技巧.大家可以收藏起来,方便开发随时可以复制粘贴. 0.首字 ...
- ###《VIM实用技巧》
###<VIM实用技巧> #@author: gr #@date: 2015-11-20 #@email: forgerui@gmail.com <VIM实用技巧>阅读笔记. ...
- PowerDesigner实用技巧小结(3)
PowerDesigner实用技巧小结(3) PowerDesigner 技巧小结 sqlserver数据库databasevbscriptsqldomain 1.PowerDesigner 使用 M ...
随机推荐
- 自己使用的jquery公用common.js
/*解决ie8中js数组没有indexOf方法*/ jQuery.extend({ exportResport : function(url, method, params){ var paramCo ...
- 2019 魔域java面试笔试题 (含面试题解析)
本人5年开发经验.18年年底开始跑路找工作,在互联网寒冬下成功拿到阿里巴巴.今日头条.魔域等公司offer,岗位是Java后端开发,因为发展原因最终选择去了魔域,入职一年时间了,也成为了面试官,之 ...
- Java 之 Response 文件下载案例
文件下载需求: 1. 页面显示超链接 2. 点击超链接后弹出下载提示框 3. 完成图片文件下载 分析过程: 1. 超链接指向的资源如果能够被浏览器解析,则在浏览器中展示,如果不能解析,则弹出下载提示框 ...
- Abp vNext抽茧剥丝01 使用using临时更改当前租户
在Abp vNext中,如果开启了多租户功能,在业务代码中默认使用当前租户的数据,如果我们需要更改当前租户,可以使用下面的方法 /* 此时当前租户 */ using (CurrentTenant.Ch ...
- day 04 预科
目录 变量 什么是变量 变量的组成 变量名的命名规范 注释 单行注释 多行注释 turtle库的使用 今日内容 数据类型基础 变量 具体的值 存不是目的,取才是目的 为了描述世界万物的状态,因此有了数 ...
- 【robotframework】pycharm+robotframe
一.环境搭建 二.框架介绍 1.settings 是这个测试套件的全局配置表 说明这个测试套件要使用的测试库.资源文件 测试套件的环境初始化(setup)和清除(teardown) 该套件内的标签等 ...
- linux中的【;】【&&】【&】【|】【||】说明与用法
原文 “;”分号用法 方式:command1 ; command2 用;号隔开每个命令, 每个命令按照从左到右的顺序,顺序执行, 彼此之间不关心是否失败, 所有命令都会执行. “| ”管道符用法 上一 ...
- javascript一个在网页上画线的库
文章;安利一个绘制指引线的JS库leader-line 一个在网页上划线的库感觉很不错.
- phantomJS+Python 隐形浏览器
phantomjs解压后,把文件夹bin中的phantomjs.exe移到python文件夹中的Scripts中 实例: from selenium import webdriver driver = ...
- 实用的Python库
一.Django 1.自动实现图片压缩: pip install easy-thumbnails / https://pypi.org/project/easy-thumbnails/2.实现定时任务 ...