pandas数据结构之基础运算笔记
import pandas as pd
import numpy as np s = pd.Series([1,3,5,6,8],index=list('acefh'))
s.index # 读取行索引
# 输出 Index(['a', 'c', 'e', 'f', 'h'], dtype='object') s.reindex(list('abcdefgh')) # 索引再定义,与元索引相同,值不变,其它变为NaN
s.reindex(list('abcdefgh'),fill_value=0) # 将其它的索引设置默认值0
s.reindex(list('abcdefgh'), method='ffill')
# 其它元Series没有的索引的值对应上一行已有的索引对应值 df = pd.DataFrame(np.random.randn(4,6),index=list('ADFH'),columns=['one','two','three','four','five','six'])
df2 = df.reindex(index=list('ABCDEFGH'))
# DataFrame中再定义行索引,新的索引将默认赋值NaN df.reindex(index=list('ABCDEFGH'),fill_value=0) # DataFrame中为新的索引赋值0
df.loc['A']['one'] = 100 # 将‘A'行’one‘列赋值100 df.reindex(columns=['one','three','five','seven'],fill_value=0) df.reindex(index=list('ABCDEFGH'),method='ffill') # method只对列有效果
# method='ffill',找到上面一行的对应列的值 赋值给新添加的行
# 但是df没有改变 但是df没有改变 但是df没有改变 但是df没有改变 但是df没有改变 df.drop('A') # 默认按行
df.drop(['two','four'],axis=1) #按列
# 但是df没有改变 但是df没有改变 但是df没有改变 但是df没有改变 但是df没有改变 df = pd.DataFrame(np.arange(12).reshape(4,3),index=['one','two','three','four'],columns=list('ABC')) df.apply(lambda x: x.max()-x.min()) # 按列
df.apply(lambda x: x.max()-x.min(), axis=1) # 按行 def min_max(x):
return pd.Series([x.min(),x.max()],index=['min','max']) # 按行
df.apply(min_max, axis=1) df = pd.DataFrame(np.random.randn(4,3),index=['one','two','three','four'],columns=list('ABC')) # formater = lambda x: '%.03f' % x
formater = '{0:0.3f}'.format # 两个结果相同,取3位有效数字 df = pd.DataFrame(np.random.randint(1,10,(4,3)),index=list('ABCD'),columns=['one','two','three']) df.sort_values(by='two',ascending=False) 通过by找到主要排序列对象 ascending=False按从大到小排列 s = pd.Series([3,6,2,6,4]) s.rank(method='average')
# 默认,rank表示列中的值对应的大小排位号(小的数排位靠前)
# df未改变 df未改变 df未改变 df未改变 df未改变 df未改变 df.rank(method='first') # 按列取排位号(小的数排位靠前)
s = pd.Series(list('abbcdabacad'))
s.value_counts() # 列中相应的值出现的次数
s.unique() # 找出列中所有不重复的值
s.isin(['a','c','d']) # 判断列中的值在['a','c','d']是否有相同的值
s.isin(s.unique()) # 判断列中的值在array(['a', 'b', 'c', 'd'])是否有相同的值
pandas数据结构之基础运算笔记的更多相关文章
- 读书笔记一、pandas数据结构介绍
pandas数据结构介绍 主要两种数据结构:Series和DataFrame. Series Series是一种类似于一维数组的对象,由一组数据(各种NumPy数据类型)+数据标签(即索引)组 ...
- python之pandas学习笔记-pandas数据结构
pandas数据结构 pandas处理3种数据结构,它们建立在numpy数组之上,所以运行速度很快: 1.系列(Series) 2.数据帧(DataFrame) 3.面板(Panel) 关系: 数据结 ...
- Oracle基础学习笔记
Oracle基础学习笔记 最近找到一份实习工作,有点头疼的是,有阶段性考核,这...,实际想想看,大学期间只学过数据库原理,并没有针对某一数据库管理系统而系统的学习,这正好是一个机会,于是乎用了三天时 ...
- 尚学堂JAVA基础学习笔记
目录 尚学堂JAVA基础学习笔记 写在前面 第1章 JAVA入门 第2章 数据类型和运算符 第3章 控制语句 第4章 Java面向对象基础 1. 面向对象基础 2. 面向对象的内存分析 3. 构造方法 ...
- pandas教程1:pandas数据结构入门
pandas是一个用于进行python科学计算的常用库,包含高级的数据结构和精巧的工具,使得在Python中处理数据非常快速和简单.pandas建造在NumPy之上,它使得以NumPy为中心的应用很容 ...
- <数据结构与算法分析>读书笔记--运行时间计算
有几种方法估计一个程序的运行时间.前面的表是凭经验得到的(可以参考:<数据结构与算法分析>读书笔记--要分析的问题) 如果认为两个程序花费大致相同的时间,要确定哪个程序更快的最好方法很可能 ...
- <数据结构与算法分析>读书笔记--函数对象
关于函数对象,百度百科对它是这样定义的: 重载函数调用操作符的类,其对象常称为函数对象(function object),即它们是行为类似函数的对象.又称仿函数. 听起来确实很难懂,通过搜索我找到一篇 ...
- 黑马程序猿————Java基础日常笔记---反射与正則表達式
------Java培训.Android培训.iOS培训..Net培训.期待与您交流! ------- 黑马程序猿----Java基础日常笔记---反射与正則表達式 1.1反射 反射的理解和作用: 首 ...
- 嵩天老师的零基础Python笔记:https://www.bilibili.com/video/av13570243/?from=search&seid=15873837810484552531 中的15-23讲
#coding=gbk#嵩天老师的零基础Python笔记:https://www.bilibili.com/video/av13570243/?from=search&seid=1587383 ...
随机推荐
- (转)mysql更改数据目录
mysql 更改默认数据目录 http://www.cnblogs.com/chenny7/p/3642363.html 本文主要介绍在CentOS下通过yum命令安装MySQL之后,如何移动默认数据 ...
- ssh sshpass随笔
1: 当通过ssh连接远程服务器的时候,可能会出现以下繁琐场景,需要手工输入yes: ssh username@ip 这对于某些分布式集群来说是不行的,甚至导致集群都不能启动成功,对于像pssh,ps ...
- PHP 之Html标签转义与反转义
1.htmlentities()函数转义html 2.html_entity_decode()函数反转义html 我这里是用来反转义富文本编辑器的内容
- 解决一些python的问题记录
1.python3中出现ModuleNotFoundError: No module named 'pkg_resources' wget https://bootstrap.pypa.io/ez_s ...
- GC类型以及不同类型GC的搭配
jdk1.7 默认垃圾收集器Parallel Scavenge(新生代)+Parallel Old(老年代) jdk1.8 默认垃圾收集器Parallel Scavenge(新生代)+Parallel ...
- linux下如何删除乱码文件
首先执行ls -i命令,此时在文件前面会出现一个数字,这个数字是文件的节点号 接着,执行命令 find -inum 节点号 -delete 即可将乱码文件成功删除
- Go -- IP to int ip字符串和十进制相互转化
package main import ( "fmt" "net" "reflect" "github.com/thinkerid ...
- markdown中如何设置字体为红色?
答: 语法如下: <font color='red'> text </font>
- [Java复习] 缓存Cache part2
7. Redis持久化有哪几种方式?不同的持久化机制都有什么优缺点?持久化机制具体底层是如何实现的? 为什么要持久化? 如果只是存在内存里,如果redis宕机再重启,内存数据就丢失了,所以要用持久化机 ...
- pytorch中的学习率调整函数
参考:https://pytorch.org/docs/master/optim.html#how-to-adjust-learning-rate torch.optim.lr_scheduler提供 ...