pandas模块常用函数解析之Series(详解)
pandas模块常用函数解析之Series
关注公众号“轻松学编程”了解更多。
以下命令都是在浏览器中输入。
cmd命令窗口输入:jupyter notebook
打开浏览器输入网址http://localhost:8888/
一、导入模块
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
二、Series
Series是一种类似于一维数组的对象,由下面两个部分组成:
- values:一组数据(ndarray类型)
- index:相关的数据索引标签
1、Series的创建
两种创建方式
1.1 由列表或numpy数组创建
默认索引为0到N-1的整数型索引
#使用列表创建Series
s1=Series(data=[1,2,3,4,5])
s1
type(s1)
结果为:
pandas.core.series.Series
#使用numpy创建Series
s2=Series(data=np.linspace(0,10,3))
s2
使用Index参数指定索引
s3=Series(data=np.random.randint(60,100,size=(3)),
index=['语文','数学','英语'])
s3
使用name参数
s4=Series(data=np.random.randint(60,100,size=(3)),
index=['语文','数学','英语'],name='分数')
s4
1.2 由字典创建
不能再使用index,但是依然存在默认索引(即0,1,2,3…) 。
dic={
'python':99,
'java':80,
'C++':70
}
s5=Series(data=dic)
s5
注意:数据源(data)要为一维数组。
2、Series的索引和切片
可以使用中括号取单个索引(此时返回的是元素类型),
或者中括号里一个列表取多个索引(此时返回的是一个Series类型)。分为显示索引和隐式索引:
2.1显式索引
- 使用index中的元素作为索引值
- 使用s.loc:注意,loc中括号中放置的一定是显示索引
s=Series(data=np.random.randint(60,100,size=(5,)),
index=['python','java','php','c','c#'],name="分数")
s
s['python']
结果为:
92
#取多个索引
s[['php','java']]
结果为:
php 91
java 69
Name: 分数, dtype: int32
#使用.loc[]
s.loc['java']
结果为:
69
s.loc[['php','java']]
2.2 隐式索引
- 使用整数作为索引值
- 使用.iloc:iloc中的中括号中必须放置隐式索引
#s[0]对应为s['python]
s[0]
结果为:
92
s[[1,2]]
s.iloc[0]
结果为:
92
s.iloc[[1,2]]
2.3 显式索引切片
使用冒号进行切片:
- 显示索引切片:index和loc
s.loc['python':'java']
2.4隐式索引切片
使用冒号进行切片:
- 隐式索引切片:整数索引值和iloc
s.iloc[1:3]
3、Series的基本概念
可以把Series看成一个定长的有序字典。
向Series增加一行:相当于给字典增加一组键值对。
#增加
s['C++']=70
s
可以通过shape,size,index,values等得到series的属性
s.shape
结果为:
(6,)
s.size
结果为:
6
s.index
结果为:
Index(['python', 'java', 'php', 'c', 'c#', 'C++'], dtype='object')
s.values
结果为:
array([92, 69, 91, 63, 84, 70], dtype=int64)
可以使用s.head(),**tail()**分别查看前n个和后n个值 ,默认n=5。
s.head(3)
s.tail(3)
当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况 。
可以使用pd.isnull(),pd.notnull(),或s.isnull(),notnull()函数检测缺失数据
4、 Series的运算
4.1 + - * /
4.2 add() sub() mul() div()
s1.add(s2) #s1加上s2
4.3 Series之间的运算
- 在运算中自动对齐不同索引的数据
- 如果索引不对应,则补NaN
下面是Python 操作符与pandas操作函数的对应表:
| Python Operator | Pandas Method(s) |
|---|---|
+ |
add() |
- |
sub(), subtract() |
* |
mul(), multiply() |
/ |
truediv(), div(), divide() |
// |
floordiv() |
% |
mod() |
** |
pow() |
5、取 Series 的最大\小值的索引值
可以使用:
获取最大值索引:argmax() 、 idxmax ()
获取最小值索引:argmin() 、 idxmin ()
s=Series(data={
"语文":120,
"数学":109,
"英语":130
})
s
6、把索引变成列
使用reset_index()函数
s=Series(data={
"语文":120,
"数学":109,
"英语":130
},name="分数")
s
s.reset_index(name='分数')
7、获取索引位置
s=Series(data=['a','b','c','d'])
np.argwhere(s[['a']])[0][0]
输出:
0
8、数组维数转换
s=Series(data=['a','b','c','d'])
#转换成一列四行的2维数组
#newaxis相当于是None的意思
s[:,np.newaxis]
效果等同:
s.reshape(-1,1)
9、使用np.hstack()合并数组
x=Series(data=[1,2,3,4])
y=Series(data=[1,2,3,4])
#先把x和y转成二维数组,然后再合并
np.hstack((x.reshape(-1,1),y.reshape(-1,1)))
类似与x轴和y轴合并成坐标点。
后记
【后记】为了让大家能够轻松学编程,我创建了一个公众号【轻松学编程】,里面有让你快速学会编程的文章,当然也有一些干货提高你的编程水平,也有一些编程项目适合做一些课程设计等课题。
也可加我微信【1257309054】,拉你进群,大家一起交流学习。
如果文章对您有帮助,请我喝杯咖啡吧!
公众号


关注我,我们一起成长~~
pandas模块常用函数解析之Series(详解)的更多相关文章
- python重要的第三方库pandas模块常用函数解析之DataFrame
pandas模块常用函数解析之DataFrame 关注公众号"轻松学编程"了解更多. 以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter notebook 打开浏览器 ...
- numpy.random模块常用函数解析
numpy.random模块中常用函数解析 numpy.random模块官方文档 1. numpy.random.rand(d0, d1, ..., dn)Create an array of the ...
- Jmeter 常用函数(31)- 详解 __iterationNum
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 作用 获取当前线程的循环次数,跟线程组属性挂 ...
- Jmeter 常用函数(20)- 详解 __counter
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.htm 作用 计数器,跟配置元件里面的计数器作用类似哦 ...
- Jmeter 常用函数(1)- 详解 __Random
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 作用 产生一个随机数 语法格式 ${__Ra ...
- Jmeter 常用函数(2)- 详解 __RandomDate
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 作用 产生一个随机日期 语法格式 ${__R ...
- Jmeter 常用函数(3)- 详解 __RandomString
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 作用 根据指定的字符产生一个随机字符串 语法 ...
- Jmeter 常用函数(4)- 详解 __setProperty
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 前言 有看我之前写的 Jmeter 文章的童 ...
- Jmeter 常用函数(5)- 详解 __property
如果你想查看更多 Jmeter 常用函数可以在这篇文章找找哦 https://www.cnblogs.com/poloyy/p/13291704.html 作用 读取 Jmeter 属性 语法格式 $ ...
随机推荐
- MySQL 5.7二进制日志
简介 二进制日志是MySQL服务器用来记录数据修改事件的,比如INSERT.UPDATE.DELETE等会导致数据发生变化的语句,SELECT语句不会被记录在内.MySQL必须先执行完一条语句才能知道 ...
- Centos-统计文件或目录占用磁盘空间-du
du 显示文件或目录所占磁盘空间总量 相关选项 -s 显示文件或者整个目录的大小,默认单位为KB -b 指定单位为byte -h 人类友好读方式显示 -m 指定单位为 MB
- 重启springboot
前言:springboot项目开发时,会遇到项目重新启动的情况.在百度上资料比较零碎需要整理,实践时需要踩坑,自己在项目中已经实现的功能拿出来与大家分享.希望每一位coder能在编程的路上少走一些弯路 ...
- python使用xpath(超详细)
使用时先安装 lxml 包 开始使用 和beautifulsoup类似,首先我们需要得到一个文档树 把文本转换成一个文档树对象 from lxml import etree if __name__ = ...
- Hadoop理论基础
Hadoop是 Apache 旗下的一个用 java 语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台.允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理. 特性:扩 ...
- 从字节码层次看i++和++i
关于的Java的i++和++i的区别,初学者可能会混淆,这时候有经验的同学或同事就会告诉你,++在后,就会立马加值, ++在后则会等会儿再加,所以如果i == 0 ,那么i++ == 0,++i == ...
- 非阻塞I/O和阻塞I/O
1.简介 等待队列实现在事件上的条件等待:希望等待特定事件的进程把自己放进合适的等待队列,并放弃控制权.可用于: - 中断处理 - 进程同步 - 定时 2.等待队列头数据结构 1 typedef st ...
- 多测师讲解性能测试_面试题_001高级讲师肖sir
什么叫做性能测试?1. 软件的性能是软件的一种非功能特性,它关注的不是软件是否能够完成特定的功能,所以一般来说性能测试介入的时机是在功能测试完成之后.另外,由定义中的及时性可知性能也是一种指标,可以 ...
- spring-boot-route(十六)使用logback生产日志文件
日志是一个系统非常重要的一部分,我们经常需要通过查看日志来定位问题,今天我们一起来学习一下Spring Boot的日志系统.有很多同学习惯性的在生产代码中使用System.out来输出日志,这是不推荐 ...
- 霍夫曼编码(Huffman)
题目:有一个字符串:cabcedeacacdeddaaaba,问题: (1)采用霍夫曼编码画出编码的过程,并写出各字符的编码 (2)根据求得的编码,求得各编码需要的总位数 (3)求出整个字符串总编码长 ...