Pandas的数据结构

1、Series

Series是一种类似于一维数组的对象，由下面两个部分组成：

index：相关的数据索引标签
values：一组数据（ndarray类型）

series的创建方法:

1.直接传入一个列表

s1 = Series([1,2,3,4])
s1

0    1

1    2

2    3

3    4

dtype: int64

查看series对象的属性:

    s1.index  # 索引

    s1.values

还可以带上index参数,表示里这个参数作为索引

s2 = Series(data=[1,2,3,4],index=list('abcd'))

2.用字典的方式去创建

Series({'a':1,'b':2,'c':3})

a    1

b    2

c    3

dtype: int64

series的索引和切片

显式索引：

使用index中的元素作为索引值
使用.loc['索引名']（推荐）

s1 = Series(data=[150,150,150,300],index=list('语数外综'))

s1

语    150

数    150

外    150

综    300

dtype: int64

s1.loc[['语','外']]  # 同一个维度 取多个值 要用中括号括起来

s1.loc[['语','语']]

s1.loc[['综','语']]

s1.loc['语':'外']  # 文字索引 切片 开始位置和结束位置都能取到

s2 = Series(data=[1,2,3,4,5,6],index=list('abcdef'))
s2

s2.loc['b':'e':2]  # 也可以跳着取 2代表的是step

# s2.loc['e':'b':-1]  # 注意 如果想倒着取 前面切片的属性 也得是倒着的

隐式索引：

使用整数作为索引值
使用.iloc[ 索引号 ]（推荐）

s2.iloc[0]

# 整数数组形式的索引 通过iloc同样可以使用

s2.iloc[[2,2,2,2,2]]

s2.iloc[[3,2,1,0]]

s2.loc['a':'c']

s2.iloc[0:3]  # 显示索引 切片的时候是 包括最后一个的 隐式索引 不包括最后一个

series的常用属性和方法

可以把Series看成一个定长的有序字典

可以通过shape,size,index,values等得到series的属性

s2.head()  # 如果不传参数 默认展示头5个内容

s2.tail()  # 查看最后的几个

Series中如果值是None，会被转成NaN。并且计算时会被当成0（ndarray不会）
可以使用pd.isnull()，pd.notnull()，或自带isnull(),notnull() 函数检测值为None或NaN的数据

另外 series对象有一个name属性可以用来区分不同的series

series的运算

(1) 适用于numpy的数组运算也适用于Series

s2

a    1

b    2

c    3

d    4

e    5

f    6

dtype: int64

#s2+2

s2*2

a     2

b     4

c     6

d     8

e    10

f    12

dtype: int64

(2) Series之间的运算

在运算中自动对齐不同索引的数据
如果索引不对应，则补NaN(值和NaN相加的结果还是NaN，如果想要让NaN的值当作0处理，可以用s1.add(s2,fill_value=0)来处理)

pandas的数据结构之series的更多相关文章

pandas 的数据结构（Series， DataFrame）
Pandas 讲解 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标 ...
Python数据分析之pandas基本数据结构：Series、DataFrame
1引言本文总结Pandas中两种常用的数据类型: (1)Series是一种一维的带标签数组对象. (2)DataFrame,二维,Series容器 2 Series数组 2.1 Series数组构成 ...
Pandas的使用（3）---Pandas的数据结构
Pandas的使用(3) Pandas的数据结构 1.Series 2.DataFrame
Pandas之数据结构
pandas入门由于最近公司要求做数据分析,pandas每天必用,只能先跳过numpy的学习,先学习大Pandas库 Pandas是基于Numpy构建的,让以Numpy为中心的应用变得更加简单 pa ...
pandas 的数据结构Series与DataFrame
pandas中有两个主要的数据结构:Series和DataFrame. [Series] Series是一个一维的类似的数组对象,它包含一个数组数据(任何numpy数据类型)和一个与数组关联的索引. ...
pandas中数据结构-Series
pandas中数据结构-Series pandas简介 Pandas是一个开源的,BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具.Python与Pan ...
pandas的数据结构介绍（一）—— Series
pandas两个主要数据结构之一--Series 类似于一维数组,由一组数据和与其相关的一组索引组成 obj = Series([4, 7, -5, 3], index=['d', 'b', 'a', ...
Pandas 的数据结构
Pandas的数据结构导入pandas: 三剑客 from pandas import Series,DataFrame import pandas as pd import numpy as np ...
pandas的数据结构
要使用pandas,需要熟悉它的两个主要的数据结构,Series和DataFrame. Series series是一种类似于以为数组的对象,它由一组数据(各种numpy的数据类型)以及一组与之相关的 ...

随机推荐

斑马打印机ZT410中文打印
^XA ^CW1, E:SIMSUN.TTF^CI28^FO50,50^A1N,50,50^FD汉字^FS^XZ ******************************************* ...
2018-2019-1 20189203《Linux内核原理与分析》第四周作业
第一部分课本学习内核版本号:Linux内核自2013年12月起,就以A.B.C.D的方式命名.A和B变得无关紧要,C是内核的真实版本.每一个版本的变化都会带来新的特性,如内部API的变化等,改动的 ...
iPhone屏蔽IOS更新、iPhone系统更新的提示（免越狱，有效期更新至2021年）
iPhone屏蔽IOS更新.iPhone系统更新的提示(免越狱,有效期更新至2021年) 1.在Safari浏览器中粘贴如下链接,按提示打开链接. 输入http://apt.dataage.pub 2 ...
分治法——快速排序(quicksort)
先上代码 #include <iostream> using namespace std; int partition(int a[],int low, int high) { int p ...
GoldenGate使用SQLEXEC和GETVAL实现码表关联
使用OGG中的SQLEXEC参数,可以执行SQL语句或存储过程,再加上@GETVAL函数,可以在目标端获取源表没有的字段值.比如,源端有一个事实表和一个代码表COUNTRY_CODES,代码表中有两个 ...
C++ STL 顺序容器--list + 关联容器
list 双向链表,可以双向遍历,既指向前驱节点,又指向后继但不能随机访问任意元素,可动态增加或者减少元素,内存管理自动完成,增加任何元素都不会使迭代器失效, 删除元素时,除了指向当前被删元素的迭代器 ...
RXD, tree and sequence IN HDU6065
解这道题绕了好多弯路...先是把"depth of the least common ancestor"这句话忽视掉,以为是最深点与最浅点的深度差:看到某人题解(的开头)之后发现自 ...
Docker Kubernetes YAML文件常用指令
YAML文件常用指令配置文件说明: 定义配置时,指定最新稳定版API(当前为v1). 配置文件应该存储在集群之外的版本控制仓库中.如果需要,可以快速回滚配置.重新创建和恢复. 应该使用YAML格式编 ...
linux的必知必会规则
单元测试系列之二：Mock工具Jmockit实战
更多原创测试技术文章同步更新到微信公众号 :三国测,敬请扫码关注个人的微信号,感谢! 原文链接:http://www.cnblogs.com/zishi/p/6760272.html Mock工具Jm ...

pandas的数据结构之series