pandas的常用函数
1.DataFrame的常用函数:
(1)np.abs(frame) 绝对值,
(2)apply function,
lambda f= lambda x: x.max()-x.min(),frame.apply(f); frame.apply(f,axis = 1)
f(x), def f(x):
return Series([x.min(),x.max()], index=['min','max']),frame.apply(f)
(3) applymap format
f= lambda x:'%.2f' %x, frame.applymap(f) 或者 frame['e'].map(format)
2. index 或者 column的排序
行排序:frame.sort_index()
列排序:frame.sort_index(axis=1)
列降序排列:frame.sort_index(axis=1,ascending=False)
通过值进行排序:
Series.sort_values()
frame.sort_values(by = 'b')
frame.sort_values(by = ['a','b'])
3.
排名(Series.rank(method='average', ascending=True))的作用与排序的不同之处在于,
他会把对象的 values 替换成名次(从 1 到 n)。这时唯一的问题在于如何处理平级项,方法里的method参数就是起这个作用的,
他有四个值可选:average, min, max, first。
Series.rank()
frame.rank(axis=1) 按照columns 进行排序。
4.
'''function application and mapping'''
import numpy as np
from pandas import DataFrame , Series
frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])
print("frame is \n", frame)
print("np.abs(frame) is \n", np.abs(frame))
print("another frequent operation is applying a function on 1D arrays to each column or row.\n DataFrame's apply method does exactly this:")
f = lambda x: x.max()-x.min()
print("f = lambda x: x.max()-x.min()")
print("frame.apply(f):", frame.apply(f))
print("frame.apply(f,axis=1):",frame.apply(f,axis=1))
def f(x):
return Series([x.min(), x.max()], index=['min', 'max'])
print("frame.apply(f): \n", frame.apply(f))
print("the function pass to apply need not to return a scalar value,it can also return a series with multiple values") format = lambda x: '%.2f' % x
print("frame.applymap(format): \n", frame.applymap(format))
print("frame['e'].map(format): \n", frame['e'].map(format))
obj = Series(range(4),index=['d', 'a', 'b', 'c'])
print("obj.sort_index: \n", obj.sort_index()) frame = DataFrame(np.arange(8).reshape((2, 4)), index=['three', 'one'], columns= ['d', 'a', 'b', 'c'])
print("frame is \n", frame)
print("frame.sort_index() \n", frame.sort_index())
print("frame.sort_index(axis=1) \n", frame.sort_index(axis=1)) print("frame.sort_index(axis=1,ascending=False): \n", frame.sort_index(axis=1,ascending=False))
obj= Series([4, 7, -3, 2])
print("obj: \n", obj)
print("obj.sort_values(): \n", obj.sort_values()) obj1 = Series([4, np.nan, 7, np.nan, -3, 2])
print("obj1:",obj1)
print("obj1.sort_values():\n", obj1.sort_values()) frame1 = DataFrame({'b':[4,7,-3,2],'a':[0,1,0,1]})
print("frame1 is \n",frame1)
print("frame1.sort_values(by='b')\n",frame1.sort_values(by='b'))
print("frame1.sort_values(by=['a','b'] \n", frame1.sort_values(by=['a','b'])) print("Ranking is closely related to sorting,assigning ranks from one through the number of valid data points in an array")
obj2 = Series([7, -5, 7, 4, 2, 0, 4])
print("obj2.rank() is \n", obj2.rank())
obj2 = Series([7, -5, 7, 4, 2, 0, 4])
print("obj2.rank() is \n", obj2.rank())
print("obj2.rank(method='min') \n",obj2.rank(method='min'))
print("obj2.rank(method='max') \n",obj2.rank(method = 'max'))
print("obj2.rank(method='first' \n",obj2.rank(method = 'first'))
print("obj2.rank(method='dense' \n", obj2.rank(method = 'dense')) frame2 = DataFrame({'b':[4.3, 7, -3,2],'a':[0,1,0,1],'c':[-2,5,8,-2.5]})
print("frame2 is \n",frame2)
print("frame2.rank(axis=1) \n",frame2.rank(axis=1))
pandas的常用函数的更多相关文章
- python重要的第三方库pandas模块常用函数解析之DataFrame
pandas模块常用函数解析之DataFrame 关注公众号"轻松学编程"了解更多. 以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter notebook 打开浏览器 ...
- pandas模块常用函数解析之Series(详解)
pandas模块常用函数解析之Series 关注公众号"轻松学编程"了解更多. 以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter notebook 打开浏览器输入网 ...
- Pandas库常用函数和操作
1. DataFrame 处理缺失值 dropna() df2.dropna(axis=0, how='any', subset=[u'ToC'], inplace=True) 把在ToC列有缺失值 ...
- Python之Pandas库常用函数大全(含注释)
前言:本博文摘抄自中国慕课大学上的课程<Python数据分析与展示>,推荐刚入门的同学去学习,这是非常好的入门视频. 继续一个新的库,Pandas库.Pandas库围绕Series类型和D ...
- pandas常用函数之shift
shift函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示: index value1 A 0 B 1 C 2 D 3 那么如果执行以下代码: df.shift() 就会 ...
- pandas常用函数之diff
diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,举个例子,现在有一个DataFrame类型的数据df,如下: index value1 A 0 B 1 C 2 D 3 如果执行 ...
- pandas 常用函数整理
pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame im ...
- 【转载】pandas常用函数
原文链接:https://www.cnblogs.com/rexyan/p/7975707.html 一.import语句 import pandas as pd import numpy as np ...
- pandas学习(常用数学统计方法总结、读取或保存数据、缺省值和异常值处理)
pandas学习(常用数学统计方法总结.读取或保存数据.缺省值和异常值处理) 目录 常用数学统计方法总结 读取或保存数据 缺省值和异常值处理 常用数学统计方法总结 count 计算非NA值的数量 de ...
随机推荐
- 如何查看java class文件的jdk版本
方法1: 用二进制的查看方式打开该class文件,参考如下: 只看第一行数据,前面8个字节CA FE BA BE 是固定的,之后4个字节00 00 是次版本号,次版本号后面的4个字节(00 33) ...
- 闪回事务(Flashback Transaction)
到目前为止,介绍的所有功能均不会直接将数据恢复为“以前”的样子.闪回查询只是查看,闪回数据归档只是延伸了闪回查询的时间窗口,闪回事务查询虽然提供了撤销SQL,但是否执行及如何执行还需要管理员进一步手动 ...
- windows安装oracle client 18c 和plsql工具
安装须知: (1)安装平台选择.linux/windows (2)软件位数选择.32/64,如果你的plsql工具是32位,那么你就安装32位客户端,如果是64位,你就安装64位客户端. 安装过程: ...
- NodeJS中间层搭建
前言 最近碰了个壁,公司开发的一个新项目里我大胆地提出要前后端完全分离,用JavaScript模板引擎.ajax.路由等技术替代繁琐的前后端混合的业务逻辑,项目进行到一半前辈提出来仅仅靠前端的力量无法 ...
- ARKit 研究笔记一
软件需求:Xcode9.x .blender 硬件需求:iphone 6s + 系统:iOS 11 + 技能储备: ARKit .SceneKit(苹果提供的3d游戏库) 或 SpriteKit(苹果 ...
- oracle存储过程(返回列表的存储结合游标使用)总结 以及在java中的调用
这段时间开始学习写存储过程,主要原因还是因为工作需要吧,本来以为很简单的,但几经挫折,豪气消磨殆尽,但总算搞通了,为了避免后来者少走弯路,特记述与此,同时亦对自己进行鼓励. 以下是我在开发项目中第一次 ...
- 【分库分表】sharding-jdbc—分片策略
一.分片策略 Sharding-JDBC认为对于分片策略存有两种维度: 数据源分片策略(DatabaseShardingStrategy):数据被分配的目标数据源 表分片策略(TableShardin ...
- PHP秒杀系统全方位设计分析(一)
秒杀系统特点人多商品少时间短流量高外挂机器[黄牛和非黄牛] 技术分析瞬间高并发的处理能力多层次的分布式处理能力人机交互与对抗[12306验证码图片] 技术选型分析Linux+Nginx+PHP+Mys ...
- 刷新DNS解析缓存
为了提高网站的访问速度,系统会在成功访问某网站后将该网站的域名.IP地址信息缓存到本地.下次访问该域名时直接通过IP进行访问. 一些网站的域名没有变化,但IP地址发生变化,有可能因本地的DNS缓存没有 ...
- Python3.x:定义一个类并且调用
Python3.x:定义一个类并且调用 1,定一个类Shrjj(其中有属性:name, jjzt,fbsjj,etf,lof,fjlof): class Shrjj(object): def __in ...