利用pandas进行数据分析之一：pandas数据结构Series

Series是一种类似于一维数组的对象，又一组数据（各种Numpy数据类型）以及一组与之相关的数据标签（即是索引）组成。

可以将Series看成是一个定长的有序字段，因为它是索引值到数据值的一个映射。

import pandas as pd

>>>obj=pd.Series([4,5,6,7])#仅由一组数据(列表，元组)即可产生最简单的Series,索引自动生成，从0开始，可以通过values和index属性获取其数组的表示形式和索引对象

>>> obj

0 4

1 5

2 6

3 7

>>>obj=pd.Series([4,5,6,7],index=list('abcd')):#(可以是列表、元组、字典)

>>> obj

a 4

b 5

c 6

d 7

>>> obj[:2]#切片获取值和索引，同时可以对值做修改

a 4

b 5

>>> obj['a']#通过索引获取单个或者一组值 obj[['a','b']]

>>> obj[obj>5]#根据布尔值获取值

c 6

d 7

>>> obj.index #属性,可以通过赋值的方式就地修改

Index([u'a', u'b', u'c', u'd'], dtype='object')

>>> obj.values #属性，值，是数组形式

array([4, 5, 6, 7])

>>> obj.index=['a','b','d','e']#更改索引

>>> obj

a 4

b 5

d 6

e 7

>>>obj.name=' ' #属性

>>>obj.index.name=' '

>>>'b' in obj

>>> obj['d']=12 #修改值

>>> obj

a 4

b 5

d 12

e 7

>>> dirct={'salary':3000,'texas':2344}#如果只传入一个字典，则结果Series中的索引就是原字典的键

>>> obj2=pd.Series(dirct)

>>> obj2

salary 3000

texas 2344

>>> state=['salary','out']

>>> obj3=pd.Series(dirct,state)#索引和原来匹配的值灰白找出，无法对应的结果是NaN

>>> obj3

salary 3000.0

out NaN

>>> pd.isnull(obj3)#isnull用于检测是否有缺失值

salary False

out True

>>> obj2+obj3 #Series重要的功能：在算数计算中会自动对齐不同索引的数据

out NaN

salary 6000.0

texas NaN

利用pandas进行数据分析之一：pandas数据结构Series的更多相关文章

利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
利用python进行数据分析之pandas入门
转自https://zhuanlan.zhihu.com/p/26100976 目录: 5.1 pandas 的数据结构介绍5.1.1 Series5.1.2 DataFrame5.1.3索引对象5. ...
基于 Python 和 Pandas 的数据分析(2) --- Pandas 基础
在这个用 Python 和 Pandas 实现数据分析的教程中, 我们将明确一些 Pandas 基础知识. 加载到 Pandas Dataframe 的数据形式可以很多, 但是通常需要能形成行和列的数 ...
利用python进行数据分析3_Pandas的数据结构
Series #通过list构建Series ser_obj=pd.Series(range(10,20)) print(type(ser_obj))#<class 'pandas.core.s ...
利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
利用python进行数据分析之pandas库的应用（二）
本节介绍Series和DataFrame中的数据的基本手段重新索引 pandas对象的一个重要方法就是reindex,作用是创建一个适应新索引的新对象 >>> from panda ...
利用python进行数据分析之pandas库的应用（一）
一.pandas的数据结构介绍 Series Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成.仅由一组数据可产生最简单的Series. obj=Series([4 ...

随机推荐

django + dropzone.js 上传文件
1.dropzone.js http://www.dropzonejs.com/ dropzone.js是一个可预览\可定制化的文件拖拽上传,实现AJAX异步上传文件的工具 2.dropzone.js ...
ubantu的python2与python3的相关兼容更新问题
Ubuntu14.04, 系统内同时装了Python3.3 和 2.7用sudo apt-get install python-pipsudo apt-get install python3-pip分 ...
HDU 2164（模拟）
Rock, Paper, or Scissors? Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Jav ...
Codeforces Beta Round 84 (Div. 2 Only)
layout: post title: Codeforces Beta Round 84 (Div. 2 Only) author: "luowentaoaa" catalog: ...
UVALive - 3211 （2-SAT + 二分）
layout: post title: 训练指南 UVALive - 3211 (2-SAT + 二分) author: "luowentaoaa" catalog: true m ...
树链剖分【p2568】[SDOI2011]染色
Description 给定一颗有\(n\)个节点的无根树和\(m\)个操作,操作有\(2\)类: 1.将节点\(a\)到节点\(b\)路径上所有点染成颜色\(c\) 2.询问节点\(a\)到节点\( ...
CentOS下MySQL主从复制，读写分离
1.环境:所有系统都是CentOS5.5 mysql-5.6.31-2.el5,MySQL中都没有数据主服务器IP为192.168.128.230 从服务器IP为192.168.128.235 代理 ...
Java高级架构师（一）第10节：Spring+Mybatis实现DAO
maven配置memcached.jar 由于目前java memcached client没有官方的maven repository可供使用,因此使用时需要手动将其安装到本地repository. ...
理解Android绘制视图的方式
在创建自定义ViewGroup前,读者首先需要理解Android绘制视图的方式.我不会涉及过多细节,但是需要读者理解Android开发文档(见3.5节)中的一段话,这段话解释如何绘制一个布局.内容如下 ...
ueditor .net配置
ASP.NET发展时期曾经诞生过 website webapplication 两类程序. website 目前基本绝迹,就是曾经在App_Code目录中写代码,然后直接发布源码,动态编译的那种,基 ...

利用pandas进行数据分析之一：pandas数据结构Series

利用pandas进行数据分析之一：pandas数据结构Series的更多相关文章

随机推荐

热门专题