pandas主要为数据预处理

DataFrame

import pandas

food_info = pandas.read_csv("路径")  #绝对路径和相对路径都可以 type(food_info)为DataFrame

food_info.dtype_  #文件中数据的类型

food_info.head()  读出的数据显示前五条  food_info.head(3)  读出的数据显示前3行    food_info.tail(4)显示末尾4行

food_info.columns 显示列名  food_info.shape   行和列数据规模

food_info.loc[0] 取出第一行数据  food_info[3:6] 3~6行数据

food_info["列名"]  取出列  food_info["列名1","列名2"]

food_info.colums.tolist()  #把列名转化为一个list  .endswith("(9)")  找出以(g)结尾的列名

food_info["Iron_(mg)"] 以(mg)结尾的   food_info["新列名"]   #新加了一列  .max() #求某列的最大值

food_info.sort_valus("列名",inplace = True,ascending = Flase)

#按列名对某一列进行排序,inplace表示新生成一列还是原来的上改  ,ascending = Flase表示从大到小排,NaN 不管升序降序都放到最后

a = pandas.isnull(food_info["列名"]) #看看对应列那些值缺失  food_info[a] 这样就会把有缺失值的一行打印

len(a) #a的数量   food_info["列名"][条件]    .mean() 求均值

.pivot_table(index = "列名",values="",aggfunc = np.mean)#index 表示以index为基准,valus表示 值为values的平均数

.pivot_table(index = "列名",values=”列名“) #以index为基准  values列的平均数如果aggfunc未指定就为求均值

.dropna(axis =1)#按行将缺失值对应行去掉  .fillna() 对缺失值填充

fillna参数的取值 : {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default None

pad/ffill:用前一个非缺失值去填充该缺失值

backfill/bfill:用下一个非缺失值填充该缺失值

None:指定一个值去替换缺失值(缺省默认这种方式)

.reset_index(drop = True) #重新设置了一下index  原来的index 不要了 形成一个新的

def ~自定义一个函数  用.apply(函数名) 去用这个函数

python pandas库的基本内容的更多相关文章

  1. python pandas库——pivot使用心得

    python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...

  2. Python Pandas库 初步使用

    用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值

  3. Python Pandas库的学习(三)

    今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...

  4. Python——Pandas库入门

    一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...

  5. Python pandas库159个常用方法使用说明

    Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...

  6. Python Pandas库的学习(一)

    今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习 接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...

  7. Python Pandas库的学习(二)

    今天我们继续讲下Python中一款数据分析很好的库.Pandas的学习 接着上回讲到的,如果有人听不懂,麻烦去翻阅一下我前面讲到的Pandas学习(一) 如果我们在数据中,想去3,4,5这几行数据,那 ...

  8. Python Pandas 库的使用例子

    主要在jupyter notebook里面熟悉这个库的使用,它的安装方法与实现,可自行搜索. Pandas是一个优秀的数据分析工具,官网:http://pandas.pydata.org/ 相关的库使 ...

  9. python numpy库的基本内容

    import numpy as np np.getfromtxt("路径",delimiter = "," ,dtype = str)  #读取txt文件数据 ...

随机推荐

  1. POJ 3104 Drying

    最让HSQ学长头疼的就是洗衣服了.洗完之后,每件衣服都有一定单位水分,在不使用烘干器的情况下,每件衣服每分钟自然流失1个单位水分,但如果使用了烘干机则每分钟流失K个单位水分.令人遗憾是HSQ所在的宿舍 ...

  2. VMware虚拟机安装Linux系统后IP配置(二)

    1.在NAT模式下自动获取IP 2.编辑网卡配置文件(通用) 3.Ctrl+L 清屏.重启网络服务后检查网络是否正常上网 修改后本机IP地址在linux中ping通本机IP 然而在本机却ping不通l ...

  3. Django-ORM多表操作(进阶)

    一.创建模型 下面我们通过图书管理系统,来设计出每张表之间的对应关系. 通过上图关系,来定义一下我们的模型类. from django.db import models class Book(mode ...

  4. Git使用十:匿名分支和checkout命令

    匿名分支 新建个仓库,并且初始化,创建3个文件,并提交 此时在没有创建新分支的情况下,checkout一下,比如上一个快照 这一段话的意思是,使用了checkout命令,但是没有指定分支名,所以git ...

  5. tensorflow+ssd_mobilenet实现目标检测的训练

    本文在Ubuntu下使用tensorflow的object detection API来训练自己的数据集.所用模型为ssd_mobilenet,也可以使用其他的模型.当然也可以在windows下训练, ...

  6. thinkphp微信浏览器内拉起微信支付

    vendor/wxpay/pay.php <?php /* +-----------------------------------+ | 微信支付类 | +------------------ ...

  7. 联发科MT8377 MT8389 MT6589 MT6577等芯片详细解析

    MT8389大家都比较陌生,但如果我说MT6589估计大家都懂了,实质上MT8389是MT6589的一个分支,一个克隆分支,说得再明了些,就是MT6589的高耗版.如果把它看成是同一个CPU也是可以的 ...

  8. 集群环境下的Session共享

    一.Cookie机制和Session机制回顾 1)定义:Session成为“会话”,具体是指一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间.Session ...

  9. ORA-12541:tns:no listener

    打开任务管理器,查看服务,看箭头所指的三个服务是否开启即可

  10. CSS(四)

    css元素溢出 当子元素的尺寸超过父元素的尺寸时,需要设置父元素显示溢出的子元素的方式,设置的方法是通过overflow属性来设置. overflow的设置项: 1.visible 默认值.内容不会被 ...