pandas 4 处理缺失数据nan

from __future__ import print_function

import pandas as pd

import numpy as np

np.random.seed(1)

dates = pd.date_range('20130101', periods=6)

df = pd.DataFrame(np.arange(24).reshape((6,4)), index=dates, columns=['A', 'B', 'C', 'D'])

df.iloc[0,1] = np.nan

df.iloc[1,2] = np.nan                 # Nan模拟缺失的数据

print(df)

print(df.dropna(axis=0, how='all'))   # how={'any', 'all'}  全部是0才丢掉

print(df.dropna(axis=0, how='any'))   # how={'any', 'all'}  有0就丢掉行

print(df.fillna(value=0))             # 所有的nan用0填充

print(pd.isnull(df))                  # 判断每一个数据是否是Nan,是nan就输出True

print(np.any(df.isnull()) == True)    # 如果有数据缺失，就输出True

以下是所有的输出结果：

print(df)

>              A     B     C   D

> 2013-01-01   0   NaN   2.0   3

> 2013-01-02   4   5.0   NaN   7

> 2013-01-03   8   9.0  10.0  11

> 2013-01-04  12  13.0  14.0  15

> 2013-01-05  16  17.0  18.0  19

> 2013-01-06  20  21.0  22.0  23

print(df.dropna(axis=0, how='all'))   # how={'any', 'all'}

>              A     B     C   D

> 2013-01-01   0   NaN   2.0   3

> 2013-01-02   4   5.0   NaN   7

> 2013-01-03   8   9.0  10.0  11

> 2013-01-04  12  13.0  14.0  15

> 2013-01-05  16  17.0  18.0  19

> 2013-01-06  20  21.0  22.0  23

print(df.dropna(axis=0, how='any'))   # how={'any', 'all'}

>              A     B     C   D

> 2013-01-03   8   9.0  10.0  11

> 2013-01-04  12  13.0  14.0  15

> 2013-01-05  16  17.0  18.0  19

> 2013-01-06  20  21.0  22.0  23

print(df.fillna(value=0))

>              A     B     C   D

> 2013-01-01   0   0.0   2.0   3

> 2013-01-02   4   5.0   0.0   7

> 2013-01-03   8   9.0  10.0  11

> 2013-01-04  12  13.0  14.0  15

> 2013-01-05  16  17.0  18.0  19

> 2013-01-06  20  21.0  22.0  23

print(pd.isnull(df))

>                 A      B      C      D

> 2013-01-01  False   True  False  False

> 2013-01-02  False  False   True  False

> 2013-01-03  False  False  False  False

> 2013-01-04  False  False  False  False

> 2013-01-05  False  False  False  False

> 2013-01-06  False  False  False  False

print(np.any(df.isnull()) == True)

> True

END

pandas 4 处理缺失数据nan的更多相关文章

利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
Pandas汇总和处理缺失数据
汇总的函数方法说明 count 非NA的值数量 describe 针对Series和DataFrame列计算汇总统计 min.max 计算最小值和最大值 argmin.argmax 计算能够获取到 ...
Pandas之Dropna滤除缺失数据
import pandas as pd import numpy as np from numpy import nan as NaN 一.处理Series对象通过dropna()滤除缺失数据 fr ...
pandas（五）处理缺失数据和层次化索引
pandas用浮点值Nan表示浮点和非浮点数组中的缺失数据.它只是一个便于被检测的标记而已. >>> string_data = Series(['aardvark','artich ...
pandas知识点（处理缺失数据）
pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据: In [14]: string_data = Series(['aardvark','artichoke',np.nan,'avocad ...
利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)
在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析.本部分关注可以聚合.合并.重塑数据的方法. 1.层次化索引层次化索引(hierarchical indexing)是panda ...
实操 | 内存占用减少高达90%，还不用升级硬件？没错，这篇文章教你妙用Pandas轻松处理大规模数据
注:Pandas(Python Data Analysis Library) 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.此外,Pandas 纳入了大量库和一些标准的数据模型 ...
小白学 Python 数据分析（8）：Pandas （七）数据预处理
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础小白学 Python 数据分析(2):Pandas (一)概述小白学 Python 数据分析(3):P ...
小白学 Python 数据分析（12）：Pandas （十一）数据透视表（pivot_table）
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础小白学 Python 数据分析(2):Pandas (一)概述小白学 Python 数据分析(3):P ...

随机推荐

一些特殊ACII码的用法在控制台中覆盖显示、刷新显示和删除字符
很好奇怎么实现在控制台中不换行直接显示新的信息把旧的替换掉,于是找到了两个ACII码字符,他们可以帮助实现. 一个是‘\b’字符,这个字符是backspace,即删除上一个字符,于是可以清除以显示的旧 ...
Codeforces 185A Plant（递推关系 + 矩阵快速幂）
链接:传送门题意:输出第 n 年向上小三角形的个数 % 10^9 + 7 思路: 设 Fn 为第 n 年向上小三角形的个数,经过分析可以得到 Fn = 3 * Fn-1 + ( 4^(n-1) - ...
BZOJ 3126 [USACO2013 Open]Photo (单调队列优化DP)
洛谷传送门题目大意:给你一个长度为$n$的序列和$m$个区间,每个区间内有且仅有一个1,其它数必须是0,求整个序列中数字1最多的数量神题,竟然是$DP$ 定义$f_{i}$表示第i位放一个1时,最 ...
NOI 2015 品酒大会 (后缀数组+并查集)
题目大意:略 40分暴力还是很好写的,差分再跑个后缀和和后缀最大值就行了一种正解是后缀数组+并查集但据说还有后缀数组+单调栈的高端操作蒟蒻的我当然不会后缀数组求出height,然后从大到小排 ...
BZOJ 1014 [JSOI2008]火星人prefix (splay+二分答案+字符串hash)
题目大意:维护一个字符串,支持插入字符和替换字符的操作,以及查询该字符串两个后缀的最长公共前缀长度乍一看以为是后缀数组,然而并没有可持久化后缀数组(雾) 看题解才知道这是一道splay题,首先要对s ...
Python学习笔记（6）元组
2019-03-02 元组(tuple): (1)元组是不可变的,无法进行任意修改.插入.删除一个元素. (2)创建元组大部分时候用小括号,如果创建的元组中只有一个元素,需要在它的后面加上一个逗号. ...
UNIX环境高级编程（6）：文件I/O（2）
文件共享: UNIX系统支持在不同进程间共享打开的文件. 内核使用三种数据结构表示打开的文件.他们之间的关系决定了在文件共享方面一个进程对还有一个进程可能产生的影响: (1)每一个进程在进程表中都有一 ...
初识BeeFramework
由于近期的项目须要,Hybrid开发成为我開始学习的新知识.非常早之前就了解到两个开发框架--BeeFramework 和 Samurai,可是由于本人一直没有闲暇去研究,所以就一直搁置一旁了.近期才 ...
atitit。企业组织与软件project的策略战略趋势原则 attilax 大总结
atitit. 企业组织与软件project的策略战略趋势原则 attilax 大总结 1. 战略规划,适当的过度设计 1 2. 跨平台化 1 3. 可扩展性高于一切 1 4. 界面html5化 ...
sqlzoo练习答案--SELECT names/zh
name continent Afghanistan Asia Albania Europe Algeria Africa Andorra Europe Angola Africa .... name ...

pandas 4 处理缺失数据nan

以下是所有的输出结果：

pandas 4 处理缺失数据nan的更多相关文章

随机推荐

热门专题