pandas数据结构之DataFrame笔记
DataFrame输出的为表的形式,由于要把输出的表格贴上来比较麻烦,在此就不在贴出相关输出结果,代码在jupyter notebook可以顺利运行
代码中有相关解释用来加深理解方便记忆
import numpy as np
import pandas as pd d = {'one':pd.Series([1,2,3],index=['a','b','c']),
'two':pd.Series([1,2,3,4],index=['a','b','c','d'])} df = pd.DataFrame(d) # 通过字典创建DataFrame,其中'one'列,没有'd'索引,所以赋值
# 为NaN df = pd.DataFrame(d, index=['d','b','a']) # 可以对原有的DataFrame再创建,选取其中
# 的行索引,index表示行索引 df = pd.DataFrame(d, columns=['two','three']) # 也可以对列进行操作,如果选择的列
# 不存在,则自动添加到下一列
# 并赋值为NaN,colums表示的是列索引 d = {'one':[1,2,3,4],
'two':[21,22,23,24]} # 字典创建的DataFrame,键表示列索引,如果没有给定行索
# 引,DataFrame会赋默认值
df = pd.DataFrame(d) data = [(1,2.2,'Hello'),(2,3.,'World')] # 这个列表中的两个元组将作为行值被操作
df = pd.DataFrame(data,index=['one','two'],columns=list('ABC')) data = [{'a':1,'b':2},{'a':5,'b':10,'c':20}] # 这个列表中的字典的键将被作为列索引
# 创建,每个字典分别作为行处理 df = pd.DataFrame(data,index=['A','B'],columns=['a','b','e'])
# 再次定义列索引时,若字典中没有对应的列将赋值为NaN,对应的列位置也将被
# cloums对应的列索引取代 d = {('a','b'):{('A','B'):1,('A','C'):2}, # 字典中最外层作为键的元组的第一个元素作为
# 第一行的列索引,
('a','a'):{('A','C'):1,('A','B'):4}, # 第二个元素作为第二行的列索引
('a','c'):{('A','B'):1,('A','C'):6}, # 作为值的字典,将被作为行操作,其中作为键的
# 元组第一个元素
('b','a'):{('A','C'):1,('A','B'):8}, # 作为第一例的行索引,第二个元素作为第二列的
# 行索引
('b','b'):{('A','D'):1,('A','B'):10}}
df = pd.DataFrame(d) s = pd.Series(np.random.randn(5), index=['a','b','c','d','e'])
pd.DataFrame(s,columns=['A'],index=list('acd'))
# 取Series创建的表的一部分(a,c,d) df = pd.DataFrame(np.random.randn(6,4),columns=['one','two','three','four'])
df['one'] # 在DataFrame中默认取列索引
df.loc[1] # 用loc函数取到的是行索引的值
df['three'] = df['one']+df['two'] # 通过索引赋值,元表改变,索引值可以相加
del df['three'] # 也可以删除索引值
df['flag'] = df['one'] > 0.2 # 这是布尔型索引
df['five'] = 5 # 对列索引赋单值时,这个列对应的所有行值为所赋的那个值 s = df.pop('four') # pop函数取出某个列也可以用在DataFram中
df.insert(1,'bar',df['one']+df['two'])
# 1表示插入在1位置,'bar',插入的列名,df['one']+df['two']为列的值 df改变 df.assign(Ratio = df['one']/df['two'])
# assign函数添加末列其中Ratio表示列索引,df['one']/df['two']为列值
# 但是df没有改变 但是df没有改变 但是df没有改变 df.assign(Ratio = lambda x: x.one-x.two)
# x表示整个表,x.one, x.two表示对应的列值 df.assign(ABRatio = df.one / df.two).assign(BarValue = lambda x: x.ABRatio*x.bar) # 连续assign也可以 df = pd.DataFrame(np.random.randint(1,10,(6,4)),index=list('abcdef'),columns=list('ABCD'))
df['A'] # 列索引取值
df.loc['a'] # 行索引取值
df.iloc[1] # 通过数值取行索引值
df[1:4] # 通过行范围索引取值
df.iloc[1:4] # 与df[1:4]效果一样
df.A>4 # 判断A列大于4的情况
df[df.A>=4] # 索引也可以是表达式,以表的形式返回大于4的值 df1 = pd.DataFrame(np.random.randn(10,4),index=list('abcdefghij'),columns=['A','B','C','D'])
df2 = pd.DataFrame(np.random.randn(7,3),index=list('cdefghi'),columns=['A','B','C'])
df1+df2 # 行列索引无法对应的取NaN
df1-df1.iloc[0] # DataForm可以与单行相减
np.exp(df2) # DataForm可以使用numpy的函数
np.sin(df2)
df2.values # 返回的是数组 type(df2.values)
# 输出numpy.ndarray np.asarray(df2) == df2.values
#输出
array([[ True, True, True],
[ True, True, True],
[ True, True, True],
[ True, True, True],
[ True, True, True],
[ True, True, True],
[ True, True, True]])
pandas数据结构之DataFrame笔记的更多相关文章
- pandas 学习(2): pandas 数据结构之DataFrame
DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型.在其底层是通过二维以及一维的数据块实现. 1. ...
- pandas数据结构之DataFrame操作
这一次我的学习笔记就不直接用官方文档的形式来写了了,而是写成类似于“知识图谱”的形式,以供日后参考. 下面是所谓“知识图谱”,有什么用呢? 1.知道有什么操作(英文可以不看) 2.展示本篇笔记的结构 ...
- pandas数据结构之Dataframe
Dataframe DataFrame是一个[表格型]的数据结构,可以看做是[由Series组成的字典](多个series共用同一个索引).DataFrame由按一定顺序排列的多列数据组成.设计初衷是 ...
- pandas数据结构之Panel笔记
Panel创建的是三维的表 items:坐标轴0,索引对应的元素是一个DataFrame major_axis:坐标轴1,DataFrame里的行标签 minor_axis:坐标轴2,DataFram ...
- pandas数据结构之Series笔记
对Series的理解也源于对其相关的代码操作,本次仅贴一些代码来加深理解以及记忆 import pandas as pd import numpy as np s = pd.Series(np.ran ...
- 03. Pandas数据结构
03. Pandas数据结构 Series DataFrame 从DataFrame中查询出Series 1. Series Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一 ...
- pandas数据结构:Series/DataFrame;python函数:range/arange
1. Series Series 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index). 1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会 ...
- Pandas 数据结构Dataframe:基本概念及创建
"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符串.布尔值等. Dataframe中的数据以一个或多个二维块存放,不是列表.字 ...
- python之pandas学习笔记-pandas数据结构
pandas数据结构 pandas处理3种数据结构,它们建立在numpy数组之上,所以运行速度很快: 1.系列(Series) 2.数据帧(DataFrame) 3.面板(Panel) 关系: 数据结 ...
随机推荐
- python 3 安装
如果本机安装了python2,尽量不要管他,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境, 比如yum!!!!! 不要动现有的python2环境! 一.安装p ...
- NAT(地址转换技术)学习
一.什么是NAT,NAT产生的背景 NAT通常部署在一个组织的网络出口位置,通过将内部网络IP地址替换为出口的IP地址提供公网可达性和上层协议的连接能力. NAT产生的背景是为了解决IPv4地址不足的 ...
- Alpha项目冲刺! Day3-产出
各个成员今日完成的任务 林恩:任务分工,博客撰写,完善设置等模块 杨长元:安卓本地数据库基本建立 李震:完成注册页面 胡彤:完善服务端 寇永明:画图,学习 王浩:画图,学习 李杰:画图,学习 各个成员 ...
- Linux系统下vi编辑器的一些简单使用操作
Linux系统安装vi编辑器 打开终端,输入: sudo apt install vim 然后输入Y等待安装即可 Linux系统下使用vi编辑器的使用 安装好vim后,终端中输入vim即可进入vim编 ...
- spring (反射+代理+DI+AOP)
spring https://baijiahao.baidu.com/s?id=1620606848227713760&wfr=spider&for=pc 反射 https://bl ...
- ASP程序中调用Now()总显示“上午”和“下午”,如何解决?
ASP程序中调用Now()总显示这样的格式:“2007-4-20 下午 06:06:38”,我要的正确格式为“2007-4-20 18:06:38”,我已经通过控制面板==>区域和语言选项==& ...
- 阶段5 3.微服务项目【学成在线】_day17 用户认证 Zuul_12-用户退出-服务端
实现退出 用户退出要以下动作: 1.删除redis中的token 2.删除cookie中的token controller内定义 spring securety config内放行 对这个url放行 ...
- 查看QML数据类型
assist输入: QML Types A Abstract3DSeries AbstractActionInput AbstractAnimation AbstractAxis AbstractAx ...
- [AI] 深度数学 - Bayes
数学似宇宙,韭菜只关心其中实用的部分. scikit-learn (sklearn) 官方文档中文版 scikit-learn Machine Learning in Python 一个新颖的onli ...
- Spring Cloud(7):事件驱动(Stream)分布式缓存(Redis)及消息队列(Kafka)
分布式缓存(Redis)及消息队列(Kafka) 设想一种情况,服务A频繁的调用服务B的数据,但是服务B的数据更新的并不频繁. 实际上,这种情况并不少见,大多数情况,用户的操作更多的是查询.如果我们缓 ...