Pandas 复习2

import pandas as pd

import numpy as np

food_info = pd.read_csv('food_info.csv')

1.处理缺失值(可使用平均数，众数填充)

    查看非缺失值的数据：

        price_is_null = pd.isnull(food_info["Price"])

        price = food_info["Price"][price_is_null==False]

    使用 fillna 填充

        food_info['Price'].fillna(food_info['Price'].mean(),inplace = True)

2.求平均值

    food_info["Price"].mean()

3.查看每一个 index 级,values 的平均值

    food_info.pivot(index = "",values = "",aggfunc = np.mean)

4.查看总人数

    food_info.pivot(index = "",values = ["",""],aggfunc = np.sum)

5.丢弃缺失值

    dropna_columns = food_info.dropna(axis = 1)

    将 Price 和 Time 列存在 NaN 的行去掉

        new_food_info = food_info.dropna(axis = 0,subset = ["Price","Time"])

6.定位具体值到 83

    row_index_83_price = food_info.loc[83,"Price"]

7.进行排序(sort_values 默认升序)

    new_food_info.sort_values("Price")

8.将索引值重新排序，使用 reset_index

    new_food_info.reset_index(drop = True)

9.使用 apply 函数

    new_food_info.apply(函数名)

10.查看缺失值的个数

    def not_null_count(column):

        column_null = pd.isnull(column)

        # column_null 为空的布尔类型

        null = column[column_null]

        # 将为空值的列表传递给 null

        return len(null)

    column_null_count = food_info.apply(not_null_count)

11.划分等级：年龄 成绩

    def which_class(row):

        pclass = row["Pclass"]

        if pd.isnull(pclass):

            return "未知等级"

        elif pclass == 1:

            return "第一级"

        elif pclass == 2:

            return "第二级"

        elif pclass == 3:

            return "第三级"

    new_food_info.apply(which_class,axis = 1)

12.使用 pivot_table 展示透视表

    new_food_info.pivot_table(index = " ",values=" ")

2020-04-11

Pandas 复习2的更多相关文章

Pandas 复习
1.导包 import pandas as pd 2.数据读取,文件在该代码文件夹内 food_info = pd.read_csv('food_info.csv') 3.查看类型 food_info ...
巩固复习(Hany驿站原创)_python的礼物
Python编程语言简介 https://www.cnblogs.com/hany-postq473111315/p/12256134.html Python环境搭建及中文编码 https://www ...
python基础全部知识点整理,超级全(20万字+)
目录 Python编程语言简介 https://www.cnblogs.com/hany-postq473111315/p/12256134.html Python环境搭建及中文编码 https:// ...
Python 数据分析（一）本实验将学习 pandas 基础，数据加载、存储与文件格式，数据规整化，绘图和可视化的知识
第1节 pandas 回顾第2节读写文本格式的数据第3节使用 HTML 和 Web API 第4节使用数据库第5节合并数据集第6节重塑和轴向旋转第7节数据转换第8节字符串操作 ...
python基础复习
复习-基础一.review-base 其他语言吗和python的对比 c vs Python c语言是python的底层实现,解释器就是由python编写的. c语言开发的程序执行效率高,开发现率低 ...
18-11-01 pandas 学习03
[python]pandas display选项 import pandas as pd 1.pd.set_option('expand_frame_repr', False) True就是可以换行显 ...
五、Pandas玩转数据
Series的简单运算 import numpy as np import pandas as pd s1=pd.Series([1,2,3],index=['A','B','C']) print(s ...
巩固复习(Django最基础的部分_具体查看官方文档)
Django学习路1 1.脚本不能随便运行,没准 linux 运行完就上不去了 2.pip 在 linux 上写 pip3 同理 python 写为 python3 3.在 pycharm 上安装库 ...
被 Pandas read_csv 坑了
被 Pandas read_csv 坑了 -- 不怕前路坎坷,只怕从一开始就走错了方向 Pandas 是python的一个数据分析包,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的 ...

随机推荐

模拟elementUI或使用自定义属性简单封装对话框
前言现在前端框架有许多的UI框架可以选择,但是样式或者功能不一定是我们项目中想要的,因此很多时候需要自己封装.此篇文件简单介绍一下利用自定义标签或者自定义扩展属性来封装UI组件,方便项目的其他地方复 ...
Dubbo 负载均衡的实现
前言负载均衡是指在集群中,将多个数据请求分散在不同单元上进行执行,主要为了提高系统容错能力和加强系统对数据的处理能力. 在 Dubbo 中,一次服务的调用就是对所有实体域 Invoker 的一次筛选 ...
java语言基础（二）_IDEA_方法
IDEA使用项目结构: 所有代码放置在src文件夹内新建包:在src文件夹上,右键新建包.包的命名:英文小写.数字.英文句点. 例如:使用公司域名倒写,如cn.itcast.day04.demo0 ...
css3实现背景颜色渐变，文字颜色渐变，边框颜色渐变
css3的渐变可以使用2个或者多个指定的颜色之间显示平稳的过渡的效果.这篇文章主要介绍下css3实现背景颜色渐变,文字颜色渐变,边框颜色渐变的方法,以便大家学习参考! 1.css背景颜色渐变代码: ...
如何在Linux环境下用虚拟机跑Windows!
文章目录 #0x0 Windows #0x1 安装虚拟机 #0x10 下载: #0x11 安装: #0x2 安装虚拟机windows #0x20 下载镜像 #0x21 安装镜像 #0x3 使用Wind ...
【DevCloud · 敏捷智库】两种你必须了解的常见敏捷估算方法
背景在某开发团队辅导的回顾会议上,团队成员对于优化估计具体方法上达成了一致意见.询问是否有什么具体的估计方法来做估算. 问题分析回顾意见上大家对本次Sprint的效果做回顾,其中80%的成员对于本 ...
java 面向对象（三十七）：反射（一）反射的概述
1.本章的主要内容 2.关于反射的理解 Reflection(反射)是被视为动态语言的关键,反射机制允许程序在执行期借助于Reflection API取得任何类的内部信息,并能直接操作任意对象的内部属 ...
web 部署专题（二）：gunicore 并发部署（用gunicorn+gevent启动Flask项目）
转自:https://blog.csdn.net/dutsoft/article/details/51452598 Flask,webpy,Django都带着 WSGI server,当然性能都不好, ...
web 部署专题（一）：Gunicorn运行与配置方法
Gunicorn“绿色独角兽”是一个被广泛使用的高性能的Python WSGI UNIX HTTP服务器,移植自Ruby的独角兽(Unicorn )项目,使用pre-fork worker模式,具有使 ...
Django框架08 /聚合查询、分组、F/Q查询、原生sql相关
Django框架08 /聚合查询.分组.F/Q查询.原生sql相关目录 Django框架08 /聚合查询.分组.F/Q查询.原生sql相关 1. 聚合查询 2. 分组 3. F查询和Q查询 4. o ...

Pandas 复习2

Pandas 复习2的更多相关文章

随机推荐

热门专题