目录 一:pandas数据结构介绍   python是数据分析的主要工具,它包含的数据结构和数据处理工具的设计让python在数据分析领域变得十分快捷.它以NumPy为基础,并对于需要类似 for循环 的大量数据处理的问题有非常快捷的数组处理函数.   但是pandas最擅长的领域还是在处理表格型二维以上不同数据类型数据.   基本导入语法: import pandas as pd    pandas标记缺失值或NA值为NaN.   有关python语法,数据分析简介,ipython,jupyt…
目录 二:pandas数据结构介绍   下面继续讲解pandas的第二个工具DataFrame. 二:pandas数据结构介绍 2.DataFarme   DataFarme表示的是矩阵的数据表,包含已排序的列集合,是一个二维数据工具.每一列可以是不同的数据类型值.它既有行索引又有列索引,可以看作是一组共享相同索引的Series对象.DataFarme的数组方法有很多,比如用index.name获取某列的值,用values获取行的值.这里先介绍一些常用的知识.   (1)构建DataFrame…
python数据分析学习目录 Anaconda的安装和更新 矩阵NumPy pandas数据表 matplotlib-2D绘图库学习目录                      …
向量化字符串操作 Series 和 Index对象 的str属性. 可以正确的处理缺失值 方法列表 正则表达式. Method Description match() Call re.match() on each element, returning a boolean. extract() Call re.match() on each element, returning matched groups as strings. findall() Call re.findall() on e…
Numpy数组取值 切片[:,1:5], 掩码操作arr[arr>0], 花哨的索引 arr[0, [1,5]],Pandas的操作类似 Series数据选择方法 Series对象与一维Numpy数组 和标准的Python字典 在许多方面 都一样. 1)将Series看作字典 可以使用Python字典的表达式和方法来检查 键 和索引 值 Series 可以新增,可以扩展. 2)将Series看作一维数组 Series不仅有着和字典一样的接口,而且还具备和Numpy数组一样的数组 数据选择 包括…
Numpy 的基本能力之一是快速对每个元素进行运算 Pandas 继承了Numpy的功能,也实现了一些高效技巧. 对于1元运算,(函数,三角函数)保留索引和列标签 对于2元运算,(加法,乘法),Pandas 会自动对齐索引进行计算. 通用函数:保留索引 对ser对象或 df对象使用Numpy通用函数,生成的结果是另一个保留索引的Pandas对象. 通用函数: 索引对齐 当Series 或 DataFram对象进行二元计算,会对齐俩个对象的索引 当处理不完整的额数据时,这一点非常方便 Series…
Pandas是在Numpy基础上建立的新程序库,提供了一种高效的DataFrame数据结构 本质是带行标签 和 列标签.支持相同类型数据和缺失值的 多维数组 增强版的Numpy结构化数组 行和列不在只是简单的整数索引,还可以带上标签, 三个基本数据结构 Series DataFrame Index Series Series将一组数据和一组索引绑定在一起 可以通过values 和 index属性获取数据, 与Numpy数据的区别:Numpy数组通过隐式定义的整数索引获取数值,Pandas 的Se…
简单累计功能 Series sum() 返回一个 统计值 DataFrame sum.默认对每列进行统计 设置axis参数,对每一行 进行统计 describe()可以计算每一列的若干常用统计值. 获取seaborn planets数据 github: https://github.com/mwaskom/seaborn-data.git windows: 放在用户目录下(在线下载卡.超时.) dropna()丢弃有缺失值的行. Pandas累计方法 Aggregation Descriptio…
一维数据 和 二维数据 分别使用Series 和 DataFrame 对象存储. 多维数据:数据索引 超过一俩个 键. Pandas提供了Panel 和 Panel4D对象 解决三维数据和四维数据. 实践中,更直观的形式是通过 层级索引(Hierarchical indexing, 多级索引 = > muti-indexing) 配合 多个不同 等级的一级索引 一起使用. 本节介绍 MultiIndex对象的使用,以及 普通索引 与 层级索引的转换 多级索引Series 笨方法 好方法: Mul…
1.1数组对象基础 .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px solid #000; } .table { border-collapse: collapse !important; } .table td, .table th { background-color: #fff !important; } .table-bordered th, .tab…