python pandas库的基本内容

pandas主要为数据预处理

DataFrame

import pandas

food_info = pandas.read_csv("路径") #绝对路径和相对路径都可以 type(food_info)为DataFrame

food_info.dtype_ #文件中数据的类型

food_info.head() 读出的数据显示前五条 food_info.head(3) 读出的数据显示前3行 food_info.tail(4)显示末尾4行

food_info.columns 显示列名 food_info.shape 行和列数据规模

food_info.loc[0] 取出第一行数据 food_info[3:6] 3~6行数据

food_info["列名"] 取出列 food_info["列名1","列名2"]

food_info.colums.tolist() #把列名转化为一个list .endswith("(9)") 找出以（g）结尾的列名

food_info["Iron_(mg)"] 以(mg)结尾的 food_info["新列名"] #新加了一列 .max() #求某列的最大值

food_info.sort_valus("列名"，inplace = True，ascending = Flase)

#按列名对某一列进行排序，inplace表示新生成一列还是原来的上改 ,ascending = Flase表示从大到小排，NaN 不管升序降序都放到最后

a = pandas.isnull(food_info["列名"]) #看看对应列那些值缺失 food_info[a] 这样就会把有缺失值的一行打印

len(a) #a的数量 food_info["列名"][条件] .mean() 求均值

.pivot_table(index = "列名"，values="",aggfunc = np.mean）#index 表示以index为基准，valus表示值为values的平均数

.pivot_table(index = "列名"，values=”列名“) #以index为基准 values列的平均数如果aggfunc未指定就为求均值

.dropna(axis =1)#按行将缺失值对应行去掉 .fillna() 对缺失值填充

fillna参数的取值： {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default None

pad/ffill：用前一个非缺失值去填充该缺失值

backfill/bfill：用下一个非缺失值填充该缺失值

None：指定一个值去替换缺失值（缺省默认这种方式）

.reset_index(drop = True) #重新设置了一下index 原来的index 不要了形成一个新的

def ~自定义一个函数用.apply(函数名) 去用这个函数

python pandas库的基本内容的更多相关文章

python pandas库——pivot使用心得
python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...
Python Pandas库初步使用
用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值
Python Pandas库的学习（三）
今天我们来继续讲解Python中的Pandas库的基本用法那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...
Python——Pandas库入门
一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...
Python pandas库159个常用方法使用说明
Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...
Python Pandas库的学习（一）
今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...
Python Pandas库的学习（二）
今天我们继续讲下Python中一款数据分析很好的库.Pandas的学习接着上回讲到的,如果有人听不懂,麻烦去翻阅一下我前面讲到的Pandas学习(一) 如果我们在数据中,想去3,4,5这几行数据,那 ...
Python Pandas 库的使用例子
主要在jupyter notebook里面熟悉这个库的使用,它的安装方法与实现,可自行搜索. Pandas是一个优秀的数据分析工具,官网:http://pandas.pydata.org/ 相关的库使 ...
python numpy库的基本内容
import numpy as np np.getfromtxt("路径",delimiter = "," ,dtype = str) #读取txt文件数据 ...

随机推荐

matplotlib学习笔记
1.简介 matplotlib是python的一个2D绘图库,它可以在不同平台上地使用多种通用的绘图格式(hardcopy formats)和交互环境绘制出出版物质量级别的图片.matplotlib可 ...
SpringMVC的入门示例
1.配置流程说明第一步:导入包第二步:构建一个请求,编写请求页面第三步:配置核心控制器第四步:构建一个业务控制器第五步:编写Spring配置文件第六步:编写一个返回页面 2.配置流程--- ...
django-admin.py startproject testdj 失败没有工程文件夹
今天第一次用django创建工程时一直没有反应,没有期望的文件夹出现第一种:网上查找了一下,发现是因为py文件的默认打开不是python.exe,而是编辑器解决方法:先随便找一个py文件,点击右键 ...
Python学习笔记九
Python学习笔记之九为什么要有操作系统管理硬件,提供接口. 管理调度进程,并且将多个进程对硬件的竞争变得有序. 操作系统发展史第一代计算机:真空管和穿孔卡片没有操作系统,所有的程序设计直接 ...
highcharts的dataLabels如何去处阴影
问题: 在使用highcharts生成的图标中dataLabels是有阴影的,通常是影响美观,那么如何去除阴影呢? 原因:是因为highcharts将dataLabels生成的标签是tspan,里面有 ...
如何在cocos中为节点添加监听事件
一般在监听键盘事件时,可是采用以下方式来监听键盘事件: 以及记得定义取消监听的函数(这个摧毁函数会自己调用吗?): 同时这里还有一种传统的监听方式: 但是cocos官方的文档建议我们不要使用这种方式, ...
pandas合并数据集-【老鱼学pandas】
有两个数据集,我们想把他们的结果根据相同的列名或索引号之类的进行合并,有点类似SQL中的从两个表中选择出不同的记录并进行合并返回. 合并首先准备数据: import pandas as pd imp ...
webpack打包后的文件
用了webpack打包工具,你是不是有时会疑惑,写了一个很简单的函数,结果生成那么多东西,而且还没有问题?下面,我从三种情况来分析打包后的入口文件,帮助自己理解webpack打包,也为平时定位产出目录 ...
最优装载—dp
最优装载—dp 动态规划一问题描述二问题分析三代码实现 package dp_Loading; import java.io.BufferedWriter; import java.io. ...
ECMA Script 6_数值的扩展
1. 二进制和八进制新的表示法前缀 0b(或0B) 表示二进制前缀 0o(或 0O )表示八进制 console.log(0b111110111 === 503); // true co ...

python pandas库的基本内容

python pandas库的基本内容的更多相关文章

随机推荐

热门专题