pandas的数据结构介绍(一)—— Series
pandas两个主要数据结构之一——Series
- 类似于一维数组,由一组数据和与其相关的一组索引组成
obj = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
print(obj)
'''
d 4
b 7
a -5
c 3
dtype: int64
'''
- 可通过索引,选取单个或多个值
tmp = ['a', 'b']
print(obj[tmp])
"""
a -5
b 7
dtype: int64
"""
- 也可根据布尔型数组进行运算
print(obj[obj > 0])
print(obj*2)
"""
d 4
b 7
c 3
dtype: int64
d 8
b 14
a -10
c 6
dtype: int64
"""
- 还可以看作是定长的有序字典
data = {'a': 1, 'b': 2, 'c': 3, 'd': -1}
obj2 = Series(data) # 通过字典直接生成Series
print(obj2)
"""
a 1
b 2
c 3
d -1
dtype: int64
"""
t = 'a' in obj2 # 判断‘a’是否为obj2索引
print(t)
"""
True
"""
- 生成Series时,无对应值自动填充为
NaN,且Series对数据会根据索引自动对齐
# 如果 obj2 = Series(data, index = ...) 中,index对应无对应值,则其填充为NaN
index = ['a', 'e', 'b', 'c', 'd'] # 多了一个‘e’,并且位置不同(在生成时会自动对齐)
obj3 = Series(data, index=index)
print(obj3)
"""
a 1.0
e NaN
b 2.0
c 3.0
d -1.0
dtype: float64
"""
# 数据是否缺失可用isnull检测
print(obj3.isnull())
"""
a False
e True
b False
c False
d False
dtype: bool
"""
- Series可进行运算,不过与
NaN运算结果始终为NaN
obj4 = Series({'a': 1, 'b': 2, 'd': -1, 'e': 5})
print(obj4)
print(obj3+obj4)
"""
a 1
b 2
d -1
e 5
dtype: int64
# obj4 中无‘c’索引,其默认为NaN
# 运算完后会自动排序
a 2.0
b 4.0
c NaN
d -2.0
e NaN
dtype: float64
"""
- Series本身及其索引均有一个name属性
obj4.name = 'obj4'
obj4.index.name = 'index'
print(obj4)
"""
index
a 1
b 2
d -1
e 5
Name: obj4, dtype: int64
"""
- Series索引可通过赋值方式就地修改
obj4.index = [1, 2, 3, 4] # 索引个数要相同,且更改后索引名会清空
print(obj4)
"""
1 1
2 2
3 -1
4 5
Name: obj4, dtype: int64
"""
pandas的数据结构介绍(一)—— Series的更多相关文章
- pandas的数据结构之series
Pandas的数据结构 1.Series Series是一种类似于一维数组的对象,由下面两个部分组成: index:相关的数据索引标签 values:一组数据(ndarray类型) series的创建 ...
- Pandas之数据结构
pandas入门 由于最近公司要求做数据分析,pandas每天必用,只能先跳过numpy的学习,先学习大Pandas库 Pandas是基于Numpy构建的,让以Numpy为中心的应用变得更加简单 pa ...
- Python pandas 0.19.1 Intro to Data Structures 数据结构介绍 文档翻译
官方文档链接http://pandas.pydata.org/pandas-docs/stable/dsintro.html 数据结构介绍 我们将以一个快速的.非全面的pandas的基础数据结构概述来 ...
- Python数据分析之pandas基本数据结构:Series、DataFrame
1引言 本文总结Pandas中两种常用的数据类型: (1)Series是一种一维的带标签数组对象. (2)DataFrame,二维,Series容器 2 Series数组 2.1 Series数组构成 ...
- pandas中数据结构-Series
pandas中数据结构-Series pandas简介 Pandas是一个开源的,BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具.Python与Pan ...
- 读书笔记一、pandas数据结构介绍
pandas数据结构介绍 主要两种数据结构:Series和DataFrame. Series Series是一种类似于一维数组的对象,由一组数据(各种NumPy数据类型)+数据标签(即索引)组 ...
- 02. Pandas 1|数据结构Series、Dataframe
1."一维数组"Series Pandas数据结构Series:基本概念及创建 s.index . s.values # Series 数据结构 # Series 是带有标签的一 ...
- Pandas 0 数据结构Series
# -*- encoding:utf-8 -*- # Copyright (c) 2015 Shiye Inc. # All rights reserved. # # Author: ldq < ...
- Pandas 的数据结构
Pandas的数据结构 导入pandas: 三剑客 from pandas import Series,DataFrame import pandas as pd import numpy as np ...
随机推荐
- windows桌面图标及任务管理栏丢失
背景环境: 卸载某些软件,如Auto CAD 2011 之后,会出现桌面图标和任务栏丢失的现象,某些重要文件没有保存或者不能注销及重启的动作 1:按组合键Ctrl+Shift+Esc,键调出任务管理器 ...
- 『政善治』Postman工具 — 8、Postman中Pre-request Script的使用
目录 1.Pre-request Script介绍 2.常用SNIPPETS(片段)说明 (1)获取变量脚本: (2)设置变量脚本: (3)清空变量脚本: (4)Send a request代码片段 ...
- IOS小组件(6):小组件实现时钟按秒刷新
引言 上一节中我们了解了IOS小组件的刷新机制,发现根本没法实现按秒刷新,但是看别的App里面有做到,以为用了什么黑科技,原来是因为系统提供了一个额外的机制实现时间的动态更新,不用走小组件的刷新机 ...
- Date类常用方法总结(构造|格式化输出|String转换|Long转换|计算间隔|比较)
java.util.Date类 它重写了toString方法,new一个Date类直接输出是按照这样的格式 // "EEE MMM dd HH:mm:ss zzz yyyy"Fri ...
- 3D饼/环Echarts图的实现
首先确保在项目中引入了echarts和echarts-gl"echarts": "^4.9.0","echarts-gl": "^ ...
- 『动善时』JMeter基础 — 23、JMeter中使用“用户自定义变量”实现参数化
目录 1.用户自定义变量介绍 2.使用"用户自定义变量"实现参数化 (1)测试计划内包含的元件 (2)数据文件内容 (3)测试计划界面内容 (4)线程组元件内容 (5)CSV数据文 ...
- [Java] Solr & Elasticsearch
背景 实现网站自带的搜索功能,如淘宝中的商品搜索 全文搜索 数据分类 结构化数据:固定格式或长度有限的数据,如数据库.元数据等 非结构化数据:不定长或无固定格式的数据,如邮件.word文档等 搜索分类 ...
- 052.Python前端Django框架路由层和视图层
一.路由层(URLconf) 1.1 路由层简单配置 URL配置(URLconf)就像Django 所支撑网站的目录.它的本质是URL与要为该URL调用的视图函数之间的映射表:你就是以这种方式告诉Dj ...
- IT菜鸟之路由器基础配置(静态、动态、默认路由)
路由器:连接不同网段的设备 企业级路由和家用级路由的区别: 待机数量不同(待机量) 待机量:同时接通的终端设备的数量 待机量的值越高,路由的性能越好 别墅级路由,表示信号好,和性能无关 交换机:背板带 ...
- 3.2-3 tac、more
3.2 tac命令 是cat的反向拼写,因此命令的功能为反向显示文件内容.cat命令是从第一行开始读取文本输出的,而tac则是从最后一行开始读取文本并进行反向输出,需要注意的是,2个命令都是以一行文本 ...