pandas入门之Series

一、创建Series

参数

- Series (Series)是能够保存任何类型的数据(整数，字符串，浮点数，Python对象等)的一维标记数组。轴标签统称为索引。

- data 参数

- index 索引 索引值必须是唯一的和散列的，与数据的长度相同。 默认np.arange(n)如果没有索引被传递。

- dtype 输出的数据类型 如果没有，将推断数据类型

- copy 复制数据 默认为false

数组创建

data = ['a','b','c','d','e']

res= pd.Series(data,index=[i for i in range(1,6)],dtype=str)

print(res)

1    a

2    b

3    c

4    d

5    e

dtype: object

字典创建

data = {"a":1.,"b":2,"c":3,"d":4}

res = pd.Series(data,index=["d","c","b","a"])

print(res)        # 字典的键用于构建索引

d    4.0

c    3.0

b    2.0

a    1.0

dtype: float64

常量创建

# 如果数据是常量值，则必须提供索引。将重复该值以匹配索引的长度。

res = pd.Series(5,index=[1,2,3,4,5])

print(res)   

1    5

2    5

3    5

4    5

5    5

dtype: int64

二、数据查询

切片

data = [1,2,3,4,5]

res = pd.Series(data,index=["a","b","c","d","e"])

print(res[0:3],"---")  # 这里跟python的切片一样

print(res[3],"---")

print(res[-3:],"---")

a    1

b    2

c    3

dtype: int64 ---

4 ---

c    3

d    4

e    5

dtype: int64 ---

使用索引检索数据

data = [1,2,3,4,5]

res = pd.Series(data,index=["a","b","c","d","e"])

print(res["a"])

# 检索多个值 标签用中括号包裹

print(res[["a","b"]]) # 如果用没有的标签检索则会抛出异常KeyError: 'f'

1

a    1

b    2

dtype: int64

data = [1,2,3,4,5]

res = pd.Series(data)

res[[2,4]]

2    3

4    5

dtype: int64

使用head()/tail()查看前几个或后几个

data = [1,2,3,4,5]

res = pd.Series(data,index=["a","b","c","d","e"])

res.head(3)  # 查看前三个

res.tail(2)  # 查看后两个

三、其他操作

series元素进行去重

unique() 对series元素进行去重

s = pd.Series(data=[1,1,2,2,3,4,5,6,6,6,7,6,6,7,8])

s.unique()

array([1, 2, 3, 4, 5, 6, 7, 8], dtype=int64)

两个series元素相加

Series之间的运算

- 在运算中自动对齐不同索引的数据
- 如果索引不对应，则补NaN

# 当索引没有对应的值时，可能出现缺失数据显示NaN（not a number）的情况

s1 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","e"])

s2 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","f"])

s = s1 + s2

s

a    2.0

b    4.0

c    6.0

d    8.0

e    NaN

f    NaN

dtype: float64

监测缺失的数据

isnull()  # 缺失的数据返回的布尔值为True

notnull() # 缺失的数据返回的布尔值为False

isnull

s1 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","e"])

s2 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","f"])

s = s1 + s2

s.isnull()  # 缺失的数据返回的布尔值为True

a    False

b    False

c    False

d    False

e     True

f     True

dtype: bool

notnull

s1 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","e"])

s2 = pd.Series(data=[1,2,3,4,5],index=["a","b","c","d","f"])

s = s1 + s2

s.notnull()  # 缺失的数据返回的布尔值为False

a     True

b     True

c     True

d     True

e    False

f    False

dtype: bool

如果将布尔值作为Serrise的索引，则只保留True对应的元素值

s[[True,True,False,False,True,True]] 

a    2.0

b    4.0

e    NaN

f    NaN

dtype: float64

根据上面的特性,可以取出所有空的数据和所有不为空的数据

s[s.isnull()]   # 取所有空值

e   NaN

f   NaN

dtype: float64

s[s.notnull()]  # 取出不为空的数据

a    2.0

b    4.0

c    6.0

d    8.0

dtype: float64

s.index  # 取出索引

Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')

pandas入门之Series的更多相关文章

利用Python进行数据分析——pandas入门
利用Python进行数据分析--pandas入门基于NumPy建立的 from pandas importSeries,DataFrame,import pandas as pd 一.两种数据结构 ...
Python 数据处理库 pandas 入门教程
Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...
利用python进行数据分析之pandas入门
转自https://zhuanlan.zhihu.com/p/26100976 目录: 5.1 pandas 的数据结构介绍5.1.1 Series5.1.2 DataFrame5.1.3索引对象5. ...
利用python进行数据分析--pandas入门2
随书练习,第五章 pandas入门2 # coding: utf-8 # In[1]: from pandas import Series,DataFrame import pandas as pd ...
利用python进行数据分析--pandas入门1
随书练习,第五章 pandas入门1 # coding: utf-8 # In[1]: from pandas import Series, DataFrame # In[2]: import pa ...
pandas 入门（3）
from pandas import Series, DataFrame, Index import numpy as np # 层次化索引对数据重塑和分组操作很有用 data = Series(n ...
< 利用Python进行数据分析 - 第2版 > 第五章 pandas入门读书笔记
<利用Python进行数据分析·第2版>第五章 pandas入门--基础对象.操作.规则 python引用.浅拷贝.深拷贝 / 视图.副本视图=引用副本=浅拷贝/深拷贝浅拷贝/深拷贝 ...
python数据分析之pandas库的Series应用
一.pandas的数据结构介绍 1. Series 1.1 Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成.仅由一组数据可产生最简单的Series. from p ...
二、pandas入门
import numpy as np import pandas as pd Series: #创建Series方法1 s1=pd.Series([1,2,3,4]) s1 # 0 1 # 1 2 # ...

随机推荐

Myatis之bind标签
myBatis的bind的标签,一般的用法都是 <if test="name!= null and name!= '' "> <bind name="u ...
.Net Core Swagger:Actions require an explicit HttpMethod binding for Swagger 2.0
添加完Swagger包引用后运行报错:Actions require an explicit HttpMethod binding for Swagger 2.0 第一时间想到了父类控制器没有添加 ...
编译 recastnavigation
1. https://github.com/memononen/recastnavigation 下载zip并解压 2. 打开https://www.libsdl.org/download-2.0 ...
WordPress，SAP Kyma和微信三者的集成
我们来继续学习如何在实战中使用SAP Kyma. Jerry在之前的文章里,分别介绍了如何本地搭建WordPress实例: 什么?在SAP中国研究院里还需要会PHP开发? 以及如何把这个本地搭建的Wo ...
springmvc模式下的上传和下载
接触了springmvc模式后,对上一次的上传与下载进行优化, 上次请看这里. 此处上传的功能依旧是采用表格上传.文件格式依旧是 <form action="${pageContext ...
07_Azkaban工作流调度器简介及其安装
Azkaban介绍 Azkaban是一个Linkedin开源的一个批量工作流任务调度器.用于在一个工作流内以一个特定的顺序运行一组工作和流程. Azkaban定义了一种KV文件格式来建立任务之间的依赖 ...
哲学家就餐问题 C语言实现
场景: 原版的故事里有五个哲学家(不过我们写的程序可以有N个哲学家),这些哲学家们只做两件事--思考和吃饭,他们思考的时候不需要任何共享资源,但是吃饭的时候就必须使用餐具,而餐桌上的餐具是有限的,原版 ...
用js刷剑指offer(矩形覆盖)
题目描述我们可以用21的小矩形横着或者竖着去覆盖更大的矩形.请问用n个21的小矩形无重叠地覆盖一个2*n的大矩形,总共有多少种方法? 牛客网链接思路依旧是斐波那契数列 2 * n的大矩形,和n个 ...
Maven 发布项目到Jetty服务器———5
官网: http://www.eclipse.org/jetty/documentation/current/jetty-maven-plugin.html 1.安装配置插件 2. 运行命令: je ...
webpack中环境变量的使用方法
这节课讲解一下,在webpack打包过程中,怎么去使用一些环境变量. 首先我有一个打包配置的三个文件 "scripts": { "dev-build": &qu ...

pandas入门之Series

一、创建Series

参数

数组创建

字典创建

常量创建

二、数据查询

切片

使用索引检索数据

使用head()/tail()查看前几个或后几个

三、其他操作

series元素进行去重

两个series元素相加

监测缺失的数据

isnull

notnull

如果将布尔值作为Serrise的索引，则只保留True对应的元素值

pandas入门之Series的更多相关文章

随机推荐

热门专题