pandas的apply操作

pandas的apply操作类似于Scala的udf一样方便，假设存在如下dataframe：

  id_part                  pred               pred_class v_id

0       d  [0.722817, 0.650064]                  cat,dog   d1

1       5  [0.119208, 0.215449]  other_label,other_label   d2

需要把 v_id=d1 中，pred 与 pred_class 一一对应，需要将 pred 大于0.5的pred_class取出来作为新的一列，如果小于0.5则不取出来：

import pandas as pd

# 提取类别

def get_pred_class(pred_class, pred):

    pred_class_list = pred_class.split(",")

    result_class_list = []

    for i in range(0, len(pred)):

        if float(pred[i]) >= 0.5:

            result_class_list.append(pred_class_list[pred.index(pred[i])])

    return result_class_list

# 新建一个dataframe

data = pd.DataFrame({

    'v_id': ["d1", 'd2'],

    'pred_class': ["cat,dog", 'other_label,other_label'],

    'pred': [[0.722817,0.650064], [0.119208,0.215449]],

    'id_part': ["d", '5'],

})

df = data.copy()

df["pos_labels"] = data.apply(lambda row: get_pred_class(row['pred_class'], row['pred']), axis=1)

print(df)

得到结果为：

  id_part                  pred               pred_class v_id  pos_labels

0       d  [0.722817, 0.650064]                  cat,dog   d1  [cat, dog]

1       5  [0.119208, 0.215449]  other_label,other_label   d2          []

PS：如果没有df = data.copy()将会出现错误：

A value is trying to be set on a copy of a slice from a DataFrame.

Try using .loc[row_indexer,col_indexer] = value instead

pandas的apply操作的更多相关文章

python数据结构：pandas(2)数据操作
一.Pandas的数据操作 0.DataFrame的数据结构 1.Series索引操作 (0)Series class Series(base.IndexOpsMixin, generic.NDFra ...
数据分析05 /pandas的高级操作
数据分析05 /pandas的高级操作目录数据分析05 /pandas的高级操作 1. 替换操作 2. 映射操作 3. 运算工具 4. 映射索引 / 更改之前索引 5. 排序实现的随机抽样/打乱表 ...
pandas DataFrame apply()函数(2)
上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame. 这篇介绍DataFrame apply()函数 ...
Pandas的基础操作（一）——矩阵表的创建及其属性
Pandas的基础操作(一)——矩阵表的创建及其属性 (注:记得在文件开头导入import numpy as np以及import pandas as pd) import pandas as pd ...
Pandas的拼接操作
pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join import pandas as pd import n ...
（四）pandas的拼接操作
pandas的拼接操作 #重点 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 0. 回顾numpy的级联 import num ...
pandas 写csv 操作
pandas 写csv 操作 def show_history(self): df = pd.DataFrame() df['Time'] = pd.Series(self.time_hist) df ...
pandas的聚合操作: groupyby与agg
pandas提供基于行和列的聚合操作,groupby可理解为是基于行的,agg则是基于列的从实现上看,groupby返回的是一个DataFrameGroupBy结构,这个结构必须调用聚合函数(如su ...
pandas：apply和transform方法的性能比较
1. apply与transform 首先讲一下apply() 与transform()的相同点与不同点相同点: 都能针对dataframe完成特征的计算,并且常常与groupby()方法一起使用. ...

随机推荐

setInterval setTimeout 详解
JavaScript的setTimeout与setInterval是两个很容易欺骗别人感情的方法,因为我们开始常常以为调用了就会按既定的方式执行, 我想不少人都深有同感, 例如 setTimeout( ...
jQuery学习之旅 Item5 $与jQuery对象
1.$符号的由来 $符号本质就是函数的名字. jquery源码分析通过分析我们知道,在jquery里边不只可以使用$符号,还可以使用jQuery标志解决冲突问题有的项目是中间过渡项目(proto ...
11. 将博客部署到tomcat上
springboot项目既可以以jar运行,也可以做成war包放到服务器上,因为我的博客项目涉及到文件上传,所以按照jar的方式就不可行,需要部署到tomcat上,具体做法如下:1. 修改pom.xm ...
selenium相关技术研究(从1.0-3.0)
注: 以下内容引自http://www.cnblogs.com/hhudaqiang/p/6550135.html Selenium相关技术研究(从1.0-3.0) 好吧,最近看wxpython有点多 ...
BZOJ_3944_Sum_杜教筛
BZOJ_3944_Sum_杜教筛 Description Input 一共T+1行第1行为数据组数T(T<=10) 第2~T+1行每行一个非负整数N,代表一组询问 Output 一共T行,每 ...
hibernate深度学习游离状态 HQL
当我学完这个之后我仿佛都懂了 = =或许这就是 hibernate的力量吧. 操纵持久化对象(Session) 1.1. 在hibernate中java对象的状态 Hibernate 把对象分为 4 ...
selenium+python，解决selenium弹出新页面，无法定位元素的问题（报错：Unable to locate element:元素）
1.问题发生描述: 从一个页面进行点击等操作,页面跳转到第二个页面,对第二个页面中的元素,采取任何措施定位都报错,问题报错点如下: 2.出现问题的原因: 窗口句柄还停留在上一个页面,对于当前新弹出的页 ...
Python爬虫入门教程 64-100 反爬教科书级别的网站-汽车之家，字体反爬之二
说说这个网站汽车之家,反爬神一般的存在,字体反爬的鼻祖网站,这个网站的开发团队,一定擅长前端吧,2019年4月19日开始写这篇博客,不保证这个代码可以存活到月底,希望后来爬虫coder,继续和汽车之 ...
Vue 进阶之路（五）
之前的文章我们说了一下 vue 的样式绑定,这篇文章来介绍一下 vue 中的条件渲染,先看下面的代码: <!DOCTYPE html> <html lang="en&quo ...
MySQL 复制 - 性能与扩展性的基石 4：主备切换
一旦使用 MySQL 的复制功能,就很大可能会碰到主备切换的情况.也许是为了迭代升级服务器,或者是主库出现问题时,将一台备库转换成主库,或者只是希望重新分配容量.不过出于什么原因,都需要将新主库的信息 ...

pandas的apply操作

pandas的apply操作的更多相关文章

随机推荐

热门专题