数据类型-Series
数据类型-Series
- Series数据类型由一组数据和数据相关的索引组成,键 -> 值
- Series数据类型可视为:一维 带标签 数组
- Series基本操作类似数组和字典
Series数据类型的创建
首先载入库
import numpy as np
import pandas as pd
Python list列表 创建Series
a = pd.Series([1,2,3,4]) #默认索引
b = pd.Series([1,2,3,4],index=['a','b','c','d']) #自定义索引
s = pd.Series([True,1,2.3,'a','你好']) #数据类型
标量值 创建Series
c = pd.Series(10,index=['a','b','c']) #必须带index
Python字典 创建Series
d = pd.Series({'a':9,'b':8,'c':7})
ndarray 创建Series,索引和数据都可以通过ndarray类型生成
n = pd.Series(np.arange(5))
m = pd.Series(np.arange(5),index=np.arange(9,4,-1))
其他函数 创建Series
n = pd.Series(range(10))
Series类型的基本操作
index和value操作
b = pd.Series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
b
b.index # 获得索引,输出index类型,就是pandas独有的索引类型
b.values # 获得数据,输出类型为array,就是np的array数组 # 索引
b['b']
b[1] # 与上面相同,自动索引是默认生成的,和自定义索引并存
b.b b[['c','d','a']]
b[['c','d',0]] #错误,两套索引并存,但不能混用 # 切片
b[:'d']
b['d':]
b[:3] b[::2]
b[::-1]
类ndarray操作
- 索引方法相同,都有[]
- numpy中的运算和操作可用于Series类型
- 可以通过自定义索引的列表进行切片
- 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片
b[3] #第3个值,结果是索引的值
b[:3] #0-3,结果还是Series类型
b[b > b.median()] #所有大于中位数的值
类python字典的操作
- 通过自定义索引访问
- 保留字in操作
- 使用.get()方法
b['b']
'c' in b #判断此键在不在b的索引中
0 in b #in 不会判断自动索引
b.get('f',100) #从b中提取索引f的值,如果存在就取出,不存在就用 100 代替
根据索引对齐操作
series + series
a = pd.Series([1,2,3],['c','d','e'])
b = pd.Series([9,8,7,6],['a','b','c','d'])
a + b #结果为两个值的并集,相加时索引对齐加值,索引不对齐的没值,加完也没值
- Series类型在运算中会自动对齐不同索引的数据
- ndarray基于维度运算,series基于索引运算,更精确不易出错
Series类型的name属性
Series对象和索引都可以起一个名字,存储在属性.name中
b = pd.Series([9,8,7,6],['a','b','c','d'])
b.name #默认没有
b.name = 'Series对象' #对象命名
b.index.name = '索引列' #索引命名
b
Series类型的修改
Series对象可以随时修改并立即生效
b['a'] = 15
b.name = 'Series'
b
b.name = 'new series'
b['b','c'] = 20 # b[['b','c']] = 20
b
数据类型-Series的更多相关文章
- Pandas学习2 --- 数据类型Series、DataFrame
为了更加清楚显示,请点击链接用Jupyter Notebook 查看:截图如下,
- Python数据分析之pandas基本数据结构:Series、DataFrame
1引言 本文总结Pandas中两种常用的数据类型: (1)Series是一种一维的带标签数组对象. (2)DataFrame,二维,Series容器 2 Series数组 2.1 Series数组构成 ...
- series和读取外部数据
1.为什么学习pandas 我们并不是不愿意学习新的知识,只是在学习之前我们更想知道学习他们能够帮助我们解决什么问题.--伟哥 numpy虽然能够帮助我们处理数值,但是pandas除了处理数值之外(基 ...
- 6.1Python数据处理篇之pandas学习系列(一)认识pandas
目录 目录 (一)介绍与测试 2.作用: 3.导入的格式 4.小测试 (二)数据类型 1.两种重要的数据类型 2.pandas与numpy的比较 目录 (一)介绍与测试 号称处理数据与分析数据最好的第 ...
- python数据分析基础——pandas Tutorial
参考pandas官方文档: http://pandas.pydata.org/pandas-docs/stable/10min.html#min 1.pandas中的数据类型 Series 带有索引标 ...
- Python的工具包[1] -> pandas数据预处理 -> pandas 库及使用总结
pandas数据预处理 / pandas data pre-processing 目录 关于 pandas pandas 库 pandas 基本操作 pandas 计算 pandas 的 Series ...
- Python爬虫作业
题目如下: 请分析作业页面(https://edu.cnblogs.com/campus/hbu/Python2018Fall/homework/2420), 爬取已提交作业信息,并生成已提 ...
- 数据摘要pandas
主要是用于分析数据的Pandas库 先学习两个数据类型DataFrame和series 进一步学习利用Pandas进行摘要的方法, 提取数据的特征 1 pandas库 1.1 pandas库 pand ...
- C# Chart 曲线(多曲线展示)
//绑定显示曲线数据(Chart控件名:) //X轴标题 this.CurveChart.ChartAreas["ChartArea1"].AxisX.Title = " ...
随机推荐
- MSCRM 2011中过滤化查询的实现方法和禁用选择视图
MS CRM 2011中过滤化查询的实现方法 使用过滤化查询,可以实现根据表单上的其他信息作为搜索条件,限制Lookup查找框中的搜索结果数量的目的. 在讲解具体的实现方法之前,先设定一个应用场景: ...
- 日期获取 net
项目中用到了,所以就写全了,供参考使用. DateTime dt=DateTime.Now;int weeknow = Convert.ToInt32(DateTime.Now.DayOfWeek); ...
- linux 线程的同步 一 (互斥量和信号量)
互斥量(Mutex) 互斥量表现互斥现象的数据结构,也被当作二元信号灯.一个互斥基本上是一个多任务敏感的二元信号,它能用作同步多任务的行为,它常用作保护从中断来的临界段代码并且在共享同步使用的资源. ...
- 关于Qt配置编译器的问题
PC系统:win10 安装了:Visual Studio 2017 Community ; Qt 5.8.0 运行Qt程序时,出现以下错误: 原因:来自知乎 只安装了VS2017(MSVC 15.0) ...
- 2018-2019 Exp3 免杀原理与实践
2018-2019 Exp3 免杀原理与实践 目录 一.实验内容说明及基础问题回答 二.实验过程 Task1 1.使用msf编码器生成后门程序及检测 Task1 2.msfvenom生成jar等文件 ...
- [转]LAMP(Linux-Apache-MySQL-PHP)网站架构
本文转自 http://www.williamlong.info/archives/1908.html LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框 ...
- Maven报错找不到jre
常规配置maven环境变量,报错: The JAVA_HOME environment variable is not defined correctly. This environment vari ...
- CentOs7安装gitlab(转!)
沧浪之水清兮,可以濯吾缨; 沧浪之水浊兮,可以濯吾足. ...
- [UE4]GetWorld()->GetDeltaSeconds()方法
void AAvatar::Yaw(float amount) { if (Controller && amount) { // AddControllerYawInput()函数用于 ...
- IP地址与子网掩码
IP地址 众所周知,为了确保通信时能相互识别,在internet上的每台主机都必须有一个唯一的标识,即主机的IP地址.IP协议就是根据IP地址来实现信息传递的. IP地址由32位(4字节)二进制数组成 ...