1、管道函数

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #pipe管道函数的应用
import pandas as pd
import numpy as np def adder(ele1,ele2):
return ele1+ele2 df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print(df)
df2=df.pipe(adder,2)#df中每一个元素都加2
print('-'*100)
print("df.pipe(adder,2) df中每一个元素都加2")
print (df2) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 -0.541685 -1.009440 -1.680244
1 -0.881437 0.022469 0.911686
2 0.930035 1.073783 0.096894
3 -1.282204 -0.039941 0.147482
4 -1.743847 -1.187832 -0.402219
----------------------------------------------------------------------------------------------------
df.pipe(adder,2) df中每一个元素都加2
col1 col2 col3
0 1.458315 0.990560 0.319756
1 1.118563 2.022469 2.911686
2 2.930035 3.073783 2.096894
3 0.717796 1.960059 2.147482
4 0.256153 0.812168 1.597781 Process finished with exit code 0

2、

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #可以使用apply()方法沿DataFrame或Panel的轴应用任意函数,它与描述性统计方法一样,采用可选的轴参数。
# 默认情况下,操作按列执行,将每列列为数组。
import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print (df)
print('-'*100)
print("df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:")
df1=df.apply(np.mean)
print (df1)
print('-'*100)
print("df2=df.apply(np.mean,axis=1) 按行执行操作:")
df2=df.apply(np.mean,axis=1)
print (df2)
print('-'*100)
df3=df.apply(lambda x: x.max() - x.min())
print("df3=df.apply(lambda x: x.max() - x.min()):")
print (df3)
print('-'*100)
df4=df['col1'].map(lambda x:x*100)
print("df4=df['col1'].map(lambda x:x*100):")
print (df4)
print('-'*100)
df5=df.applymap(lambda x:x*100)
print("df5=df.applymap(lambda x:x*100):")
print (df5) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 0.735342 0.438729 -0.261747
1 -1.490907 0.397943 0.105613
2 -0.298617 -0.328284 0.599502
3 -0.842654 0.324976 -0.047985
4 0.452950 1.102824 0.023971
----------------------------------------------------------------------------------------------------
df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:
col1 -0.288777
col2 0.387238
col3 0.083871
dtype: float64
----------------------------------------------------------------------------------------------------
df2=df.apply(np.mean,axis=1) 按行执行操作:
0 0.304108
1 -0.329117
2 -0.009133
3 -0.188555
4 0.526582
dtype: float64
----------------------------------------------------------------------------------------------------
df3=df.apply(lambda x: x.max() - x.min()):
col1 2.226249
col2 1.431108
col3 0.861248
dtype: float64
----------------------------------------------------------------------------------------------------
df4=df['col1'].map(lambda x:x*100):
0 73.534186
1 -149.090744
2 -29.861721
3 -84.265380
4 45.295040
Name: col1, dtype: float64
----------------------------------------------------------------------------------------------------
df5=df.applymap(lambda x:x*100):
col1 col2 col3
0 73.534186 43.872940 -26.174660
1 -149.090744 39.794331 10.561263
2 -29.861721 -32.828359 59.950153
3 -84.265380 32.497553 -4.798542
4 45.295040 110.282391 2.397062 Process finished with exit code 0

pandas函数应用的更多相关文章

  1. py使用笔记-pandas函数

    1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframei ...

  2. 从Excel到Python:最常用的36个Pandas函数

    本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两 ...

  3. pandas函数高级

    一.处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看No ...

  4. pandas函数的使用

    一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Serie ...

  5. Python:pandas(二)——pandas函数

    Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...

  6. pandas函数get_dummies的坑

    转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是ui ...

  7. 第六节:pandas函数应用

    1.pipe() :表格函数应用: 2.apply():表格行列函数应用: 3.applymap():表格元素应用.

  8. 【转】python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)

    二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...

  9. pandas(二)函数应用和映射

    NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 10 11 d 12 ...

随机推荐

  1. attribute与parameter区别(转)

    文章转自http://blog.csdn.net/saygoodbyetoyou/article/details/9006001 request.getParameter取得Web客户端到web服务端 ...

  2. sparse 稀疏函数的用法2

    sparse函数 功能:Create sparse matrix-创建稀疏矩阵 用法1:S=sparse(X)——将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩 ...

  3. Echarts中太阳图(Sunburst)的实例

    Echarts中太阳图(Sunburst)的实例 目前在项目中要实现一个Echars中的太阳图,但是Echars中的太阳图的数据格式是一个树形结构,如下代码格式如下: var mapData = [ ...

  4. 在windows端使用jupyter notebook,服务器充当后台计算云端 简化描述

    在CentOS7服务器端启动jupyter notebook服务,在windows端使用jupyter notebook,服务器充当后台计算云端 简化描述 CentOS7服务器端 jupyter no ...

  5. ASP 基础二 内置对象

    一 Request 二 Response 三 Application 四 Session 五 Server <script language="vbscript" runat ...

  6. 关于TCP和MQTT之间的转换

    现在物联网流行的就是MQTT 其实MQTT就是在TCP的基础上建立了一套协议 可以看这个,本来我自己想用Wireshark监听一下,不过百度一搜索一大把,我就不测试了 https://blog.csd ...

  7. CF613D Kingdom and its Cities 虚树

    传送门 $\sum k \leq 100000$虚树套路题 设$f_{i,0/1}$表示处理完$i$以及其所在子树的问题,且处理完后$i$所在子树内是否存在$1$个关键点满足它到$i$的路径上不存在任 ...

  8. GBDT和随机森林的区别

    GBDT和随机森林的相同点: 1.都是由多棵树组成 2.最终的结果都是由多棵树一起决定 GBDT和随机森林的不同点: 1.组成随机森林的树可以是分类树,也可以是回归树:而GBDT只由回归树组成 2.组 ...

  9. Combobox值自定义(不通过数据库)

    前台 <ext:ComboBox ID="cmbYear" runat="server"/> .aspx.cs int year = DateTim ...

  10. 使用Pyspark进行特征工程时的那些坑

    以脚本spark_clean_online_action.py.数据集new_sxf_time_count_1781115582.csv为例: 集群节点包括212.216.217.218.需要注意的是 ...