未经同意请勿转载http://www.cnblogs.com/smallcrystal/ 前文已经详细介绍DataFrame与Series两种数据结构,下面介绍DataFrame与Series的数据基本手段 一.pandas两种数据结构的index是不可修改的,pandas对象的一个重要方法是reindex >>> f lie     pop state  year suoyin a       1.5  ohio  2000 b       1.3  ohio  2001 c    …
Series与DataFrame对比学习 文章为本人原创,未经同意请勿转载,http://www.cnblogs.com/smallcrystal/ Series:构建的方法,一组数组(列表或元组),利用Series(),自动生成索引.或Series(字典),值只有一列,无列索引,只有行索引 属性: .index..values   .name   .index.name   .values.name >> data={'state':['ohio','ohio','ohio','nev','…
内容学习自: Python for Data Analysis, 2nd Edition         就是这本 纯英文学的很累,对不对取决于百度翻译了 前情提要: 各种方法贴: https://www.cnblogs.com/baili-luoyun/p/10250177.html 本内容主要讲的是: 继续数组和矢量 一:花式索引 定义:花式索引指的是利用整数进行索引, 假设我们有一个 8 *4的数组 arr = np.empty([8,4]) print(arr)#传入的元祖或者列表 fo…
Numpy的重要特点就是其N维数组对象, 1.ndarray每个元素是相同的,每个数组都有一个两个对象: .shape:用于表示维度大小的元组 .dtype:用户表示数组类型的对象 2.创建数组 array(将输入数据(列表.元组.数组或其他序列类型)转化为ndarray) array ([[列表1],[列表2],...],dtpye=np.int) array((元组1,元组2,...)) np.zeros(10),np.ones((n,m)),np.empty((m,n,w)) np.ara…
Series是一种类似于一维数组的对象,又一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即是索引)组成. 可以将Series看成是一个定长的有序字段,因为它是索引值到数据值的一个映射. import pandas as pd >>>obj=pd.Series([4,5,6,7])#仅由一组数据(列表,元组)即可产生最简单的Series,索引自动生成,从0开始,可以通过values和index属性获取其数组的表示形式和索引对象 >>> obj 0    4…
本文的例子需要一些特殊设置,具体可以参考 Pandas快速入门(一) 数据清理和转换 我们在进行数据处理时,拿到的数据可能不符合我们的要求.有很多种情况,包括部分数据缺失,一些数据的格式不正确,一些数据的标注问题等等.对于这些数据,我们在开始分析之前必须进行必要的整理.清理. 清理和转换的过程中用到最对的包括判断是否存在空值(obj.isnull),删除空值(dropna).填充空值(fillna).大小写转换.文字替换(replace)等等.我这里挑几个典型的场景来学习一下. 判断是否存在有空…
一.reindex() 方法:重新索引 针对 Series   重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 fill_value 参数指定填充值. 例如:   fill_value 会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充: 针对 DataFrame   重新…
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构:Series 和 DataFrame. 二.Series Series 是一个一维数组对象 ,类似于 NumPy 的一维 array.它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组. 将 Python 数组转换成 Series 对象: 将 Python 字典转换成 Serie…
一.pandas简单介绍 1.pandas是一个强大的Python数据分析的工具包.2.pandas是基于NumPy构建的.3.pandas的主要功能 --具备对其功能的数据结构DataFrame.Series --集成时间序列功能 --提供丰富的数学运算和操作 --灵活处理缺失数据4.安装方法:pip install pandas5.引用方法:import pandas as pd 二.Series Series是一种类似于一位数组的对象,由一组数据和一组与之相关的数据标签(索引)组成.创建方…
本节介绍Series和DataFrame中的数据的基本手段 重新索引 pandas对象的一个重要方法就是reindex,作用是创建一个适应新索引的新对象 >>> from pandas import Series,DataFrame >>> obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c']) >>> obj d 4.5 b 7.2 a -5.3 c 3.6 dtype: float64#rein…