本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes

1 简介

　　大家好我是费老师，pandas在前不久更新的2.2版本中，针对Series对象新增了case_when()方法，用于实现类似SQL中经典的CASE WHEN语句功能，今天的文章中，我们就来get其具体使用方法~

2 pandas中的case_when()新方法

　　首先请确保你的pandas版本大于等于2.2，在确保Python版本大于等于3.9的前提下，终端执行下列命令安装最新版本的pandas：

pip install pandas -U

2.1 case_when()的使用

　　case_when()作为Series对象的方法，其参数非常简单只有一个caselist，用于定义条件映射规则，格式如[(条件1, 替代值1), (条件2, 替代值2), ...]，最基础的用法下，每个条件为与目标Series长度相等的bool值序列，譬如下面的例子：

　　更灵活的方式，是将条件写作可执行函数，譬如lambda函数，进而引用自身实现灵活的条件判断：

　　函数式条件，在针对数据框进行链式分析的过程中，可以很灵活的基于上一步的临时计算状态，进行条件赋值操作，譬如（示例数据及代码见文章开头仓库地址）：

　　更多有关case_when()方法的介绍，请移步官方文档：https://pandas.pydata.org/docs/reference/api/pandas.Series.case_when.html

　　以上就是本文的全部内容，欢迎在评论区与我进行讨论~

（数据科学学习手札157）pandas新增case_when方法的更多相关文章

（数据科学学习手札69）详解pandas中的map、apply、applymap、groupby、agg
*从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一.简介 pandas提供了很多方 ...
（数据科学学习手札72）用pdpipe搭建pandas数据分析流水线
1 简介在数据分析任务中,从原始数据读入,到最后分析结果出炉,中间绝大部分时间都是在对数据进行一步又一步的加工规整,以流水线(pipeline)的方式完成此过程更有利于梳理分析脉络,也更有利于查错改 ...
（数据科学学习手札47）基于Python的网络数据采集实战（2）
一.简介马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集 ...
（数据科学学习手札40）tensorflow实现LSTM时间序列预测
一.简介上一篇中我们较为详细地铺垫了关于RNN及其变种LSTM的一些基本知识,也提到了LSTM在时间序列预测上优越的性能,本篇就将对如何利用tensorflow,在实际时间序列预测任务中搭建模型来完 ...
（数据科学学习手札80）用Python编写小工具下载OSM路网数据
本文对应脚本已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介我们平时在数据可视化或空间数据分析的过程中经常会 ...
（数据科学学习手札90）Python+Kepler.gl轻松制作时间轮播图
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 Kepler.gl作为一款强大的开源地理信 ...
（数据科学学习手札55）利用ggthemr来美化ggplot2图像
一.简介 R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原 ...
（数据科学学习手札50）基于Python的网络数据采集-selenium篇（上）
一.简介接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文 ...
（数据科学学习手札49）Scala中的模式匹配
一.简介 Scala中的模式匹配类似Java中的switch语句,且更加稳健,本文就将针对Scala中模式匹配的一些基本实例进行介绍: 二.Scala中的模式匹配 2.1 基本格式 Scala中模式匹 ...
（数据科学学习手札44）在Keras中训练多层感知机
一.简介 Keras是有着自主的一套前端控制语法,后端基于tensorflow和theano的深度学习框架,因为其搭建神经网络简单快捷明了的语法风格,可以帮助使用者更快捷的搭建自己的神经网络,堪称深度 ...

随机推荐

Kubernetes(K8S) 监控 Prometheus + Grafana
监控指标集群监控节点资源利用率节点数运行Pods Pod 监控容器指标应用程序 Prometheus 开源的监控.报警.数据库以HTTP协议周期性抓取被监控组件状态不需要复杂的集成过 ...
Kubernetes(K8S) Service 介绍
定义一组 Pod 的访问规则存在的意义防止 Pod 失联(服务发现),Pod 重启后,IP会变定义一组 Pod 访问策略,负载均衡 Pod 和 Service 关系根据 label 和 sel ...
OpenvSwitch系列之九 Group表
Open vSwitch系列之一 Open vSwitch诞生 Open vSwitch系列之二安装指定版本ovs Open vSwitch系列之三 ovs-vsctl命令使用 Open vSwit ...
ElasticSearch 分组聚合统计
统计总数: GET mytest-statistics/_search { "size": 0, "query": { "bool": { ...
【动态规划】动态规划基础（OI wiki）
文章来自 OI wiki ,转载仅作学习使用动态规划应用于子问题重叠的情况: 要去刻画最优解的结构特征: 尝试递归地定义最优解的值(就是我们常说的考虑从 \(i - 1\) 转移到 \(i\)): ...
Python pydot与graphviz库在Anaconda环境的配置
本文介绍在Anaconda环境中,安装Python语言pydot与graphviz两个模块的方法. 最近进行随机森林(RF)的树的可视化操作,需要用到pydot与graphviz模块:因此记录 ...
Optional详细用法
package com.example.apidemo.jdk8; import com.example.apidemo.vo.UserInfo; import java.math.BigDecima ...
深入理解 Serverless 计算的并发度
作者|西流(阿里云技术专家) 背景 2019 年 Berkeley 预测 Serverless 将取代 Serverful 计算[1],成为云计算的计算新范式.Serverless 为应用程序开发提供 ...
Kubernetes 内存资源限制实战
本文转载自米开朗基扬的博客 1. Kubernetes 内存资源限制实战 Kubernetes 对内存资源的限制实际上是通过 cgroup 来控制的,cgroup 是容器的一组用来控制内核如何运行进程 ...
SV Interface and Program
内容验证平台与待测设计的连接 VTB driver和dut之间的连线通过tb中声明wire连线通过例化dut的方式进行连接 A module的input连接到B module的output SVT ...

（数据科学学习手札157）pandas新增case_when方法

1 简介

2 pandas中的case_when()新方法

2.1 case_when()的使用

（数据科学学习手札157）pandas新增case_when方法的更多相关文章

随机推荐

热门专题