pandas的常用函数

1.DataFrame的常用函数： 
(1)np.abs(frame) 绝对值， 
(2)apply function,
　　lambda f= lambda x: x.max()-x.min(),frame.apply(f); frame.apply(f,axis = 1)
　　f(x), def f(x): 
　　　　　　return Series([x.min(),x.max()], index=['min','max']),frame.apply(f)
(3) applymap format
　　f= lambda x:'%.2f' %x, frame.applymap(f) 或者 frame['e'].map(format)

2. index 或者 column的排序
行排序：frame.sort_index()
列排序：frame.sort_index(axis=1) 
列降序排列：frame.sort_index(axis=1,ascending=False)
通过值进行排序：
Series.sort_values()
frame.sort_values(by = 'b')
frame.sort_values(by = ['a','b'])
3.
排名（Series.rank(method='average', ascending=True)）的作用与排序的不同之处在于，
他会把对象的 values 替换成名次（从 1 到 n）。这时唯一的问题在于如何处理平级项，方法里的 method 参数就是起这个作用的，
他有四个值可选：average, min, max, first。
Series.rank()
frame.rank(axis=1) 按照columns 进行排序。
4.


'''function application and mapping'''
import numpy as np
from pandas import DataFrame , Series
frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])
print("frame is \n", frame)
print("np.abs(frame) is \n", np.abs(frame))
print("another frequent operation is applying a function on 1D arrays to each column or row.\n DataFrame's apply method does exactly this:")
f = lambda x: x.max()-x.min()
print("f = lambda x: x.max()-x.min()")
print("frame.apply(f):", frame.apply(f))
print("frame.apply(f,axis=1):",frame.apply(f,axis=1))
def f(x):
    return Series([x.min(), x.max()], index=['min', 'max'])
print("frame.apply(f): \n", frame.apply(f))
print("the function pass to apply need not to return a scalar value,it can also return a series with multiple values")

format = lambda x: '%.2f' % x
print("frame.applymap(format): \n", frame.applymap(format))
print("frame['e'].map(format): \n", frame['e'].map(format))

obj = Series(range(4),index=['d', 'a', 'b', 'c'])
print("obj.sort_index: \n", obj.sort_index())

frame = DataFrame(np.arange(8).reshape((2, 4)), index=['three', 'one'], columns= ['d', 'a', 'b', 'c'])
print("frame is \n", frame)
print("frame.sort_index() \n", frame.sort_index())
print("frame.sort_index(axis=1) \n", frame.sort_index(axis=1))

print("frame.sort_index(axis=1,ascending=False): \n", frame.sort_index(axis=1,ascending=False))

obj= Series([4, 7, -3, 2])
print("obj: \n", obj)
print("obj.sort_values(): \n", obj.sort_values())

obj1 = Series([4, np.nan, 7, np.nan, -3, 2])
print("obj1:",obj1)
print("obj1.sort_values():\n", obj1.sort_values())

frame1 = DataFrame({'b':[4,7,-3,2],'a':[0,1,0,1]})
print("frame1 is \n",frame1)
print("frame1.sort_values(by='b')\n",frame1.sort_values(by='b'))
print("frame1.sort_values(by=['a','b'] \n", frame1.sort_values(by=['a','b']))

print("Ranking is closely related to sorting,assigning ranks from one through the number of valid data points in an array")
obj2 = Series([7, -5, 7, 4, 2, 0, 4])
print("obj2.rank() is \n", obj2.rank())

obj2 = Series([7, -5, 7, 4, 2, 0, 4])
print("obj2.rank() is \n", obj2.rank())
print("obj2.rank(method='min') \n",obj2.rank(method='min'))
print("obj2.rank(method='max') \n",obj2.rank(method = 'max'))
print("obj2.rank(method='first' \n",obj2.rank(method = 'first'))
print("obj2.rank(method='dense' \n", obj2.rank(method = 'dense'))

frame2 = DataFrame({'b':[4.3, 7, -3,2],'a':[0,1,0,1],'c':[-2,5,8,-2.5]})
print("frame2 is \n",frame2)
print("frame2.rank(axis=1) \n",frame2.rank(axis=1))

pandas的常用函数的更多相关文章

python重要的第三方库pandas模块常用函数解析之DataFrame
pandas模块常用函数解析之DataFrame 关注公众号"轻松学编程"了解更多. 以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter notebook 打开浏览器 ...
pandas模块常用函数解析之Series（详解）
pandas模块常用函数解析之Series 关注公众号"轻松学编程"了解更多. 以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter notebook 打开浏览器输入网 ...
Pandas库常用函数和操作
1. DataFrame 处理缺失值 dropna() df2.dropna(axis=0, how='any', subset=[u'ToC'], inplace=True) 把在ToC列有缺失值 ...
Python之Pandas库常用函数大全（含注释）
前言:本博文摘抄自中国慕课大学上的课程<Python数据分析与展示>,推荐刚入门的同学去学习,这是非常好的入门视频. 继续一个新的库,Pandas库.Pandas库围绕Series类型和D ...
pandas常用函数之shift
shift函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示: index value1 A 0 B 1 C 2 D 3 那么如果执行以下代码: df.shift() 就会 ...
pandas常用函数之diff
diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,举个例子,现在有一个DataFrame类型的数据df,如下: index value1 A 0 B 1 C 2 D 3 如果执行 ...
pandas 常用函数整理
pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame im ...
【转载】pandas常用函数
原文链接:https://www.cnblogs.com/rexyan/p/7975707.html 一.import语句 import pandas as pd import numpy as np ...
pandas学习(常用数学统计方法总结、读取或保存数据、缺省值和异常值处理)
pandas学习(常用数学统计方法总结.读取或保存数据.缺省值和异常值处理) 目录常用数学统计方法总结读取或保存数据缺省值和异常值处理常用数学统计方法总结 count 计算非NA值的数量 de ...

随机推荐

Python遇到SyntaxError: Non-ASCII character '\xe5' in file D:\eclipseworkspace\test\test_urllib2.py on line2
写Python时遇到SyntaxError: Non-ASCII character '\xe5' in file D:\eclipseworkspace\test\test_urllib2.py o ...
docker镜像上传到阿里云
目前上传本地镜像到网上有多种途径,一个是上传到hub上,一个是阿里云镜像仓库,还要其他服务器. 上传到hub上实在是太慢了,我的服务器用的是阿里云,所以选择上传到阿里云镜像仓库中. 前提条件:linu ...
C++匿名名字空间
转自:http://blog.csdn.net/eric_arrow/article/details/8978905 名字空间(namespace),是C++提供的一个解决符合名字冲突的特性.标准规定 ...
PL/SQL Developer 登录 Oracle 12c和Win10下安装Oracle 11g
安装了Oracle 12c 后使用PL/SQL Developer怎么也不能连接到Oracle 12c.网上找一下,按照fcflying所说的操作成功了,所以做个笔记: 1)安装Oracle 12c ...
win10+eclipse+hadoop2.7.2+maven+local模式直接通过Run as Java Application运行wordcount
一.准备工作 (1)Hadoop2.7.2 在linux部署完毕,成功启动dfs和yarn,通过jps查看,进程都存在 (2)安装maven 二.最终效果在windows系统中,直接通过Run as ...
CentOS系统下yum命令的详细使用方法
yum是什么yum = Yellow dog Updater, Modified 主要功能是更方便的添加/删除/更新RPM包. 它能自动解决包的倚赖性问题. 它能便于管理大量系统的更新问题 yum特点 ...
关于Log4Net的使用和配置
1. 添加log4net.dll引用 2.在添加引用的那层的 AssemblyInfo.cs 注册 : [assembly: log4net.Config.XmlConfigura ...
20145312 《Java程序设计》第八周学习总结
20145312 <Java程序设计>第八周学习总结学习笔记 Chapter 15时间与日期 15.1 日志 15.1.1 日志API简介 java.util.logging包提供了日志 ...
20145313张雪纯《Java程序设计》第7周学习总结
20145313张雪纯 <Java程序设计>7周学习总结教材学习内容总结 1967年定义的国际原子时,将秒的国际单位定义为铯原子辐射振动9192631170周耗费的时间. 为了简化日后对 ...
20145314郑凯杰《信息安全系统设计基础》第6周学习总结 part A
第4章处理器体系结构 part 1 本部分对改章节的知识点进行总结: 一个处理器支持的指令和指令的字节级编码称为它的指令集体系结构(ISA). 不同的出路器有不同的ISA. ISA模型看上去应该是顺 ...

pandas的常用函数

pandas的常用函数的更多相关文章

随机推荐

热门专题