pandas的apply操作

pandas的apply操作类似于Scala的udf一样方便，假设存在如下dataframe：

  id_part                  pred               pred_class v_id

0       d  [0.722817, 0.650064]                  cat,dog   d1

1       5  [0.119208, 0.215449]  other_label,other_label   d2

需要把 v_id=d1 中，pred 与 pred_class 一一对应，需要将 pred 大于0.5的pred_class取出来作为新的一列，如果小于0.5则不取出来：

import pandas as pd

# 提取类别

def get_pred_class(pred_class, pred):

    pred_class_list = pred_class.split(",")

    result_class_list = []

    for i in range(0, len(pred)):

        if float(pred[i]) >= 0.5:

            result_class_list.append(pred_class_list[pred.index(pred[i])])

    return result_class_list

# 新建一个dataframe

data = pd.DataFrame({

    'v_id': ["d1", 'd2'],

    'pred_class': ["cat,dog", 'other_label,other_label'],

    'pred': [[0.722817,0.650064], [0.119208,0.215449]],

    'id_part': ["d", '5'],

})

df = data.copy()

df["pos_labels"] = data.apply(lambda row: get_pred_class(row['pred_class'], row['pred']), axis=1)

print(df)

得到结果为：

  id_part                  pred               pred_class v_id  pos_labels

0       d  [0.722817, 0.650064]                  cat,dog   d1  [cat, dog]

1       5  [0.119208, 0.215449]  other_label,other_label   d2          []

PS：如果没有df = data.copy()将会出现错误：

A value is trying to be set on a copy of a slice from a DataFrame.

Try using .loc[row_indexer,col_indexer] = value instead

pandas的apply操作的更多相关文章

python数据结构：pandas(2)数据操作
一.Pandas的数据操作 0.DataFrame的数据结构 1.Series索引操作 (0)Series class Series(base.IndexOpsMixin, generic.NDFra ...
数据分析05 /pandas的高级操作
数据分析05 /pandas的高级操作目录数据分析05 /pandas的高级操作 1. 替换操作 2. 映射操作 3. 运算工具 4. 映射索引 / 更改之前索引 5. 排序实现的随机抽样/打乱表 ...
pandas DataFrame apply()函数(2)
上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame. 这篇介绍DataFrame apply()函数 ...
Pandas的基础操作（一）——矩阵表的创建及其属性
Pandas的基础操作(一)——矩阵表的创建及其属性 (注:记得在文件开头导入import numpy as np以及import pandas as pd) import pandas as pd ...
Pandas的拼接操作
pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join import pandas as pd import n ...
（四）pandas的拼接操作
pandas的拼接操作 #重点 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 0. 回顾numpy的级联 import num ...
pandas 写csv 操作
pandas 写csv 操作 def show_history(self): df = pd.DataFrame() df['Time'] = pd.Series(self.time_hist) df ...
pandas的聚合操作: groupyby与agg
pandas提供基于行和列的聚合操作,groupby可理解为是基于行的,agg则是基于列的从实现上看,groupby返回的是一个DataFrameGroupBy结构,这个结构必须调用聚合函数(如su ...
pandas：apply和transform方法的性能比较
1. apply与transform 首先讲一下apply() 与transform()的相同点与不同点相同点: 都能针对dataframe完成特征的计算,并且常常与groupby()方法一起使用. ...

随机推荐

21.app后端如何高效更新内容
在app的主页或通知栏,经常需要通过api取最新的数据.那么,怎么在这部分上做优化,使获取内容的效率更高呢?在本文中,通过推拉和增量更新,实现了一种高效获取数据的策略. 1.高效更新数据策略在app中 ...
docker开机自动重启参数
docker run -ti -d --privileged --restart=always -p : -p : -v /apps/qkaoauth:/apps/qkaoauth docker.qk ...
【BZOJ 2673】[Wf2011]Chips Challenge
题目大意: 传送门 $n*n$的棋盘,有一些位置可以放棋子,有一些已经放了棋子,有一些什么都没有,也不能放,要求放置以后满足:第i行和第i列的棋子数相同,同时每行的棋子数占总数比例小于$\frac{A ...
【BZOJ 3569】 DZY Loves Chinese II
题目连接: 传送门题解: 先%一发大佬的题解. 考虑一个图,删除一些边以后不连通的条件为,某个联通块与外界所有连边都被删掉,而不只是生成树中一个树边与所以覆盖它的非树边(很容易举出反例). 那么考虑 ...
BZOJ_3083_遥远的国度_树链剖分+线段树
BZOJ_3083_遥远的国度_树链剖分 Description 描述 zcwwzdjn在追杀十分sb的zhx,而zhx逃入了一个遥远的国度.当zcwwzdjn准备进入遥远的国度继续追杀时,守护神Ra ...
BZOJ_1877_[SDOI2009]晨跑_费用流
BZOJ_1877_[SDOI2009]晨跑_费用流题意: Elaxia最近迷恋上了空手道,他为自己设定了一套健身计划,比如俯卧撑.仰卧起坐等等,不过到目前为止,他坚持下来的只有晨跑. 现在给出 ...
JS基础：常用API
全局属性 typeof() 检测数据类型 parseInt() 从字符串解析一个整数 parseFloat() 从字符串解析一个小数 Number() 强制类型转换为数字 String() 强制类型转 ...
玩转PHP中的正则表达式
玩转PHP中的正则表达式检验用户输入.解析用户输入和文件内容,以及重新格式化字符串级别: 中级正则表达式提供了一种处理文本的强大方法.使用正则表达式,您可以对用户输入进行复杂的检验.解析用户输入 ...
关于分布式锁原理的一些学习与思考-redis分布式锁，zookeeper分布式锁
首先分布式锁和我们平常讲到的锁原理基本一样,目的就是确保,在多个线程并发时,只有一个线程在同一刻操作这个业务或者说方法.变量. 在一个进程中,也就是一个jvm 或者说应用中,我们很容易去处理控制,在j ...
线性表概述及单链表的Java实现
一.线性表概述线性表是指一组数据元素之间具有线性关系的元素序列,它表现为:除第一个元素没有直接前驱元素.最后一个元素没有直接后继元素外,其余所有元素都有且仅有一个直接前驱元素和直接后继元素. 根据存 ...

pandas的apply操作

pandas的apply操作的更多相关文章

随机推荐

热门专题