pandas函数应用

1、管道函数

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/5/24 15:03

# @Author  : zhang chao

# @File    : s.py

#pipe管道函数的应用

import pandas as pd

import numpy as np

def adder(ele1,ele2):

   return ele1+ele2

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])

print(df)

df2=df.pipe(adder,2)#df中每一个元素都加2

print('-'*100)

print("df.pipe(adder,2) df中每一个元素都加2")

print (df2)

D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py

       col1      col2      col3

0 -0.541685 -1.009440 -1.680244

1 -0.881437  0.022469  0.911686

2  0.930035  1.073783  0.096894

3 -1.282204 -0.039941  0.147482

4 -1.743847 -1.187832 -0.402219

----------------------------------------------------------------------------------------------------

df.pipe(adder,2) df中每一个元素都加2

       col1      col2      col3

0  1.458315  0.990560  0.319756

1  1.118563  2.022469  2.911686

2  2.930035  3.073783  2.096894

3  0.717796  1.960059  2.147482

4  0.256153  0.812168  1.597781

Process finished with exit code 0

2、

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/5/24 15:03

# @Author  : zhang chao

# @File    : s.py

#可以使用apply()方法沿DataFrame或Panel的轴应用任意函数，它与描述性统计方法一样，采用可选的轴参数。

#  默认情况下，操作按列执行，将每列列为数组。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])

print (df)

print('-'*100)

print("df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:")

df1=df.apply(np.mean)

print (df1)

print('-'*100)

print("df2=df.apply(np.mean,axis=1) 按行执行操作:")

df2=df.apply(np.mean,axis=1)

print (df2)

print('-'*100)

df3=df.apply(lambda x: x.max() - x.min())

print("df3=df.apply(lambda x: x.max() - x.min()):")

print (df3)

print('-'*100)

df4=df['col1'].map(lambda x:x*100)

print("df4=df['col1'].map(lambda x:x*100):")

print (df4)

print('-'*100)

df5=df.applymap(lambda x:x*100)

print("df5=df.applymap(lambda x:x*100):")

print (df5)

D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py

       col1      col2      col3

0  0.735342  0.438729 -0.261747

1 -1.490907  0.397943  0.105613

2 -0.298617 -0.328284  0.599502

3 -0.842654  0.324976 -0.047985

4  0.452950  1.102824  0.023971

----------------------------------------------------------------------------------------------------

df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:

col1   -0.288777

col2    0.387238

col3    0.083871

dtype: float64

----------------------------------------------------------------------------------------------------

df2=df.apply(np.mean,axis=1) 按行执行操作:

0    0.304108

1   -0.329117

2   -0.009133

3   -0.188555

4    0.526582

dtype: float64

----------------------------------------------------------------------------------------------------

df3=df.apply(lambda x: x.max() - x.min()):

col1    2.226249

col2    1.431108

col3    0.861248

dtype: float64

----------------------------------------------------------------------------------------------------

df4=df['col1'].map(lambda x:x*100):

0     73.534186

1   -149.090744

2    -29.861721

3    -84.265380

4     45.295040

Name: col1, dtype: float64

----------------------------------------------------------------------------------------------------

df5=df.applymap(lambda x:x*100):

         col1        col2       col3

0   73.534186   43.872940 -26.174660

1 -149.090744   39.794331  10.561263

2  -29.861721  -32.828359  59.950153

3  -84.265380   32.497553  -4.798542

4   45.295040  110.282391   2.397062

Process finished with exit code 0

pandas函数应用的更多相关文章

py使用笔记-pandas函数
1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframei ...
从Excel到Python：最常用的36个Pandas函数
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表常见的生成数据表的方法有两 ...
pandas函数高级
一.处理丢失数据有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看No ...
pandas函数的使用
一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Serie ...
Python：pandas（二）——pandas函数
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...
pandas函数get_dummies的坑
转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是ui ...
第六节：pandas函数应用
1.pipe() :表格函数应用: 2.apply():表格行列函数应用: 3.applymap():表格元素应用.
【转】python 中NumPy和Pandas工具包中的函数使用笔记（方便自己查找）
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...
pandas（二）函数应用和映射
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 10 11 d 12 ...

随机推荐

attribute与parameter区别(转)
文章转自http://blog.csdn.net/saygoodbyetoyou/article/details/9006001 request.getParameter取得Web客户端到web服务端 ...
sparse 稀疏函数的用法2
sparse函数功能:Create sparse matrix-创建稀疏矩阵用法1:S=sparse(X)——将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩 ...
Echarts中太阳图（Sunburst）的实例
Echarts中太阳图(Sunburst)的实例目前在项目中要实现一个Echars中的太阳图,但是Echars中的太阳图的数据格式是一个树形结构,如下代码格式如下: var mapData = [ ...
在windows端使用jupyter notebook，服务器充当后台计算云端简化描述
在CentOS7服务器端启动jupyter notebook服务,在windows端使用jupyter notebook,服务器充当后台计算云端简化描述 CentOS7服务器端 jupyter no ...
ASP 基础二内置对象
一 Request 二 Response 三 Application 四 Session 五 Server <script language="vbscript" runat ...
关于TCP和MQTT之间的转换
现在物联网流行的就是MQTT 其实MQTT就是在TCP的基础上建立了一套协议可以看这个,本来我自己想用Wireshark监听一下,不过百度一搜索一大把,我就不测试了 https://blog.csd ...
CF613D Kingdom and its Cities 虚树
传送门 $\sum k \leq 100000$虚树套路题设$f_{i,0/1}$表示处理完$i$以及其所在子树的问题,且处理完后$i$所在子树内是否存在$1$个关键点满足它到$i$的路径上不存在任 ...
GBDT和随机森林的区别
GBDT和随机森林的相同点: 1.都是由多棵树组成 2.最终的结果都是由多棵树一起决定 GBDT和随机森林的不同点: 1.组成随机森林的树可以是分类树,也可以是回归树:而GBDT只由回归树组成 2.组 ...
Combobox值自定义（不通过数据库）
前台 <ext:ComboBox ID="cmbYear" runat="server"/> .aspx.cs int year = DateTim ...
使用Pyspark进行特征工程时的那些坑
以脚本spark_clean_online_action.py.数据集new_sxf_time_count_1781115582.csv为例: 集群节点包括212.216.217.218.需要注意的是 ...

pandas函数应用

pandas函数应用的更多相关文章

随机推荐

热门专题