Pandas处理丢失数据

1、创建含NaN的矩阵

>>> dates = pd.date_range('', periods=6)

>>> df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates, columns=['A','B','C','D'])

>>> df.iloc[0,1] = np.nan

>>> df.iloc[1,2] = np.nan

>>> print(df)

             A     B     C   D

2013-01-01   0   NaN   2.0   3

2013-01-02   4   5.0   NaN   7

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

2、pd.dropna():直接去掉有NaN的行或列

>>> df.dropna(

...     axis=0,     # 0: 对行进行操作; 1: 对列进行操作

...     how='any'   # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop

...     )

             A     B     C   D

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

3、pd.fillna():将NaN的值用其他值代替，比如代替成0：

>>> df.fillna(value=0)

             A     B     C   D

2013-01-01   0   0.0   2.0   3

2013-01-02   4   5.0   0.0   7

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

4、pd.isnull():判断是否有缺失数据NaN,为True表示缺失数据

>>> df.isnull()

                A      B      C      D

2013-01-01  False   True  False  False

2013-01-02  False  False   True  False

2013-01-03  False  False  False  False

2013-01-04  False  False  False  False

2013-01-05  False  False  False  False

2013-01-06  False  False  False  False

>>> np.any(df.isnull()) == True#检测在数据中是否存在 NaN, 如果存在就返回 True:
True

Pandas处理丢失数据的更多相关文章

Pandas 处理丢失数据
处理丢失数据 import pandas as pd from pandas import Series, DataFrame import numpy as np 有两种丢失数据: 1. None ...
（二）pandas处理丢失数据
处理丢失数据有两种丢失数据: None np.nan(NaN) import numpy as np type(None) NoneType type(np.nan) float 1. None N ...
pandas处理丢失数据-【老鱼学pandas】
假设我们的数据集中有缺失值,该如何进行处理呢? 丢弃缺失值的行或列首先我们定义了数据集的缺失值: import pandas as pd import numpy as np dates = pd. ...
6 DataFrame处理丢失数据--数据清洗
处理丢失数据有两种丢失数据: · None · np.nan(NaN) 1 None None是Python自带的,其类 ...
.Net读取Excel文件时丢失数据的问题（转载）
相信很多人都试过通过OleDB读取Excel文件,这种方法效率十分高,只是有一点会让人十分头痛,就是当一列中既有混合型数据,又有纯数据时,往往容易丢失数据. 百度过后,改连接字符串 “HDR=YES; ...
使用ehcache持久化数据到磁盘并且在应用服务器重启后不丢失数据
使用ehcache时如何持久化数据到磁盘,并且在应用服务器重启后不丢失数据1.如何持久化到磁盘使用cache.flush(),每次写入到cache后调用cache.flush() ,这样ehcache ...
Kafka重复消费和丢失数据研究
Kafka重复消费原因底层根本原因:已经消费了数据,但是offset没提交. 原因1:强行kill线程,导致消费后的数据,offset没有提交. 原因2:设置offset为自动提交,关闭kafka时 ...
RMAN数据库恢复之丢失数据文件的恢复
删除某一数据文件:SQL> HOST del D:\app\Administrator\oradata\orcl\USERS01.dbf 启动数据库,提示丢失数据文件4,此时数据库处理MOUNT ...
RMAN数据库恢复之归档模式有(无)备份-丢失数据文件的恢复
1.归档模式有备份,丢失数据文件的恢复归档模式有备份,不管丢失什么数据文件,直接在RMAN下RESTOER--->RECOVER--->OPEN即可. RMAN> STARUP MO ...

随机推荐

Jquery 样式选择器，查找包含两种样式以上的元素
可以连写 $(".样式一.样式二") 中间不要留空格,id也一样. $(".modalDishMsgTitleWrap").find(".standa ...
怎样使用PL/SQL在不安装oracle 客户端的情况下使用oracle数据库
在网上查了好多这方面的例子,但是似乎说的都不准确,在咨询朋友后终于实现了本机不安装oracle 的情况下,在windows系统上实现连接服务器上的数据库,现在贴出来与大家共享. 首先,我们需要一个PL ...
JAVA AES CBC 加密解密
AES 256 , KEY 的长度为 32字节(32*8=256bit). AES 128 , KEY 的长度为 16字节(16*8=128bit) CBC 模式需要IV, IV的值是固定写死,还是当 ...
关于APS在企业生产计划上的应用
本人本身是一个码农,已经服务了共和国各项事业(好像是说得有点漂,没办法段子看多了)大约一半工作时候了(按60岁退休的话),从一线的小码农,到现在成了老农,出产了不少或优或劣的各种码,几乎啥都做过.近几 ...
搭建sparksql的hive测试环境
sbt依赖 name := "Pi" version := "1.0" scalaVersion := "2.10.6" libraryDe ...
jdbc与TiDB数据库交互的过程
以下是使用jdbc操作TiDB数据库,得到的交互过程和指令的说明 ==>代表发送给数据库的指令 // 加载驱动程序Class.forName(driver); // 连接数据库 Connecti ...
solr搜索
安装过程: 原料:solr-4.10.3.tgz.tgz 1.1.1 安装步骤单独一台虚拟机先全部删除:根目录:rm * -rf cd /usr/local \ rm ...
早期自学jQuery-一入门
本节目录: ----------①安装使用 ----------②语法 ----------③文档就绪函数 ----------④选择器一.安装使用(特别注意jQuery应当位于<head&g ...
【395】yield 和 yield from
yield:生成器 yield from:将生成器 yield 的内容相当于逐一在 yield 一般参考:Python 3: Using "yield from" in Gene ...
echarts Cannot read property 'getAttribute' of null 问题的解决方法
今天在使用echarts练习官方给的实例的时候,代码没有问题却总是报错“Cannot read property 'getAttribute' of null” 找了好久的文档没有看明白 ... 最 ...

Pandas处理丢失数据

Pandas处理丢失数据的更多相关文章

随机推荐

热门专题