Pandas之Dropna滤除缺失数据

import pandas as pd

import numpy as np

from numpy import nan as NaN

一、处理Series对象

通过dropna()滤除缺失数据

from numpy import nan as NaN

se1=pd.Series([4,NaN,8,NaN,5])

print(se1)

se1.dropna()

结果如下：

0    4.0

1    NaN

2    8.0

3    NaN

4    5.0

dtype: float64

0    4.0

1    NaN

2    8.0

3    NaN

4    5.0

dtype: float64

通过布尔序列也能滤除：

se1[se1.notnull()]

结果如下：

0    4.0

2    8.0

4    5.0

dtype: float64

二、处理DataFrame对象

处理DataFrame对象比较复杂，因为你可能需要丢弃所有的NaN或部分NaN

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])

print(df1)

结果如下：

     0    1    2

0  1.0  2.0  3.0

1  NaN  NaN  2.0

2  NaN  NaN  NaN

3  8.0  8.0  NaN

默认滤除所有包含NaN：

df1.dropna()

结果如下

     0    1    2

0  1.0  2.0  3.0

1  NaN  NaN  2.0

2  NaN  NaN  NaN

3  8.0  8.0  NaN

传入how=’all’滤除全为NaN的行

df1.dropna(how='all')

结果如下

     0    1    2

0  1.0  2.0  3.0

1  NaN  NaN  2.0

2  NaN  NaN  NaN

3  8.0  8.0  NaN

传入axis=1滤除列

df1[3]=NaN

df1

结果如下

     0    1    2   3

0  1.0  2.0  3.0 NaN

1  NaN  NaN  2.0 NaN

2  NaN  NaN  NaN NaN

3  8.0  8.0  NaN NaN

df1.dropna(axis=1,how="all")

结果如下

     0    1    2

0  1.0  2.0  3.0

1  NaN  NaN  2.0

2  NaN  NaN  NaN

3  8.0  8.0  NaN

传入thresh=n滤除n行

df1.dropna(thresh=1)

结果如下

0	1	2	3

0	1.0	2.0	3.0	NaN

1	NaN	NaN	2.0	NaN

3	8.0	8.0	NaN	NaN

df1.dropna(thresh=3)

结果如下

	  0	 1	 2 	  3

0	1.0	2.0	3.0	NaN

Pandas之Dropna滤除缺失数据的更多相关文章

pandas（五）处理缺失数据和层次化索引
pandas用浮点值Nan表示浮点和非浮点数组中的缺失数据.它只是一个便于被检测的标记而已. >>> string_data = Series(['aardvark','artich ...
Pandas高级教程之:处理缺失数据
目录简介 NaN的例子整数类型的缺失值 Datetimes 类型的缺失值 None 和 np.nan 的转换缺失值的计算使用fillna填充NaN数据使用dropna删除包含NA的数据插值 ...
利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
pandas知识点（处理缺失数据）
pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据: In [14]: string_data = Series(['aardvark','artichoke',np.nan,'avocad ...
利用Python进行数据分析_Pandas_处理缺失数据
申明:本系列文章是自己在学习<利用Python进行数据分析>这本书的过程中,为了方便后期自己巩固知识而整理. 1 读取excel数据 import pandas as pd import ...
Pandas汇总和处理缺失数据
汇总的函数方法说明 count 非NA的值数量 describe 针对Series和DataFrame列计算汇总统计 min.max 计算最小值和最大值 argmin.argmax 计算能够获取到 ...
Pandas处理缺失数据
利用pandas.DataFrame.dropna处理含有缺失值的数据 1.使用形式: DataFrame.dropna(axis=0, how='any', thresh=None, subset= ...
pandas的学习4-处理丢失数据
import pandas as pd import numpy as np ''' 有时候我们导入或处理数据, 会产生一些空的或者是 NaN 数据,如何删除或者是填补这些 NaN 数据就是我们今天所 ...
R语言︱处理缺失数据&&异常值检验、离群点分析、异常值处理
在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据脏数据包括:缺失值.异常值.不一致的值.重复数据及含有特殊符号(如#.¥.*)的数据数 ...

随机推荐

hadoop 日常问题汇总（持续更新）
问题描述:每次执行hadoop的shell命令时均出现如下警告: [hadoop@MyDB01 ~]$ hadoop fs -ls / 16/09/25 07:59:13 WARN util.Nati ...
有关xml中的xmlns
1. xmlns "xmlns"是XHTML namespace的缩写,叫做"名字空间"声明.名字空间是什么作用呢?我的理解是:由于xml允许你自己定义自己的标 ...
vue组件定义方式
一.全局组件 <div id="box"> {{msg}} <my-aaa></my-aaa> </div> var Home = ...
import 与 from…import 的区别
首先你要了解 import 与 from…import 的区别. import 模块:导入一个模块:注:相当于导入的是一个文件夹,是个相对路径. from…import:导入了一个模块中的一个函数:注 ...
【转】__try，__except，__finally，__leave异常模型机制
转自:http://blog.csdn.net/wwl33695/article/details/8686458 导读: 从本篇文章开始,将全面阐述__try,__except,__finally,_ ...
成员函数指针与高效C++委托 (delegate)
下载实例源代码 - 18.5 Kb 下载开发包库文件 - 18.6 Kb 概要很遗憾, C++ 标准中没能提供面向对象的函数指针. 面向对象的函数指针也被称为闭包(closures) 或委托(del ...
Linguistic Data Consortium (LDC)
搞NLP的人经常会听到一个神秘的名字LDC,因为大量的论文所使用的数据都来自于LDC,本文就来揭露其神秘面目. About LDC: LDC,全名Linguistic Data Consortium, ...
iOS - 获取安装所有App的Bundle ID
先导入#import <objc/runtime.h>头文件使用runtime获取设备上的所有app的bundle id // Class LSApplicationWorkspace_ ...
lombok 一个不错的小工具
(1)官方文档 Lombok features (2)Lombok Reduces Your Boilerplate Code (3)Lombok-Java代码自动生成开发利器
POJ 3254 - Corn Fields - [状压DP水题]
题目链接:http://poj.org/problem?id=3254 Time Limit: 2000MS Memory Limit: 65536K Description Farmer John ...

Pandas之Dropna滤除缺失数据

一、处理Series对象

二、处理DataFrame对象

Pandas之Dropna滤除缺失数据的更多相关文章

随机推荐

热门专题