使用dropna()函数去掉NaN的行或列

import pandas as pd
import pickle
import numpy as np
dates = pd.date_range('', periods=)
df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[,]=np.nan
df.iloc[,]=np.nan
print(df)
print(df.dropna(axis=,how='any'))

输出:

             A     B     C   D
-- NaN 2.0
-- 5.0 NaN
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0
A B C D
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0

使用fillna()函数替换NaN值

import pandas as pd
import pickle
import numpy as np
dates = pd.date_range('', periods=)
df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[,]=np.nan
df.iloc[,]=np.nan
print(df)
#将NaN值替换为0
print(df.fillna(value=))

输出

             A     B     C   D
-- NaN 2.0
-- 5.0 NaN
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0
A B C D
-- 0.0 2.0
-- 5.0 0.0
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0

使用isnull()函数判断数据是否丢失

import pandas as pd
import pickle
import numpy as np
dates = pd.date_range('', periods=)
df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[,]=np.nan
df.iloc[,]=np.nan
print(df)
#矩阵用布尔来进行表示 是nan为ture 不是nan为false
print(pd.isnull(df))

输出

             A     B     C   D
-- NaN 2.0
-- 5.0 NaN
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0
A B C D
-- False True False False
-- False False True False
-- False False False False
-- False False False False
-- False False False False
-- False False False False

#判断数据中是否会存在NaN值

import pandas as pd
import pickle
import numpy as np
dates = pd.date_range('', periods=)
df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[,]=np.nan
df.iloc[,]=np.nan
print(df)
#判断数据中是否会存在NaN值
print(np.any(df.isnull()))

输出

             A     B     C   D
-- NaN 2.0
-- 5.0 NaN
-- 9.0 10.0
-- 13.0 14.0
-- 17.0 18.0
-- 21.0 22.0
True

pandas 处理数据中NaN数据的更多相关文章

  1. 返回数据中提取数据的方法(JSON数据取其中某一个值的方法)

    返回数据中提取数据的方法 比如下面的案例是,取店铺名称 接口返回数据如下: {"Code":0,"Msg":"ok","Data& ...

  2. 深度学习原理与框架-CNN在文本分类的应用 1.tf.nn.embedding_lookup(根据索引数据从数据中取出数据) 2.saver.restore(加载sess参数)

    1. tf.nn.embedding_lookup(W, X) W的维度为[len(vocabulary_list), 128], X的维度为[?, 8],组合后的维度为[?, 8, 128] 代码说 ...

  3. pandas实现excel中的数据透视表和Vlookup函数功能

    在孩子王实习中做的一个小工作,方便整理数据. 目前这几行代码是实现了一个数据透视表和匹配的功能,但是将做好的结果写入了不同的excel中, 如何实现将结果连续保存到同一个Excel的同一个工作表中?还 ...

  4. pandas读取excel中指定数据的行数

    shuju = pd.read_excel(filename) loandata = pd.DataFrame(shuju) ncol = (len(loandata.keys())) data = ...

  5. java中如何从一行数据中读取数据

    目录 @(如何从一行数据中切割数据) 例如我要从一行学生信息中分割出学号.姓名.年龄.学历等等 ==主要使用split方法,split方法在API中定义如下:== public String[] sp ...

  6. JSP页面读取数据中的数据内容,出现乱码现象的解决方法

    1.首先要确保JSP页面的编码已修改为“utf-8”的字符编码: 2.然后再在jsp页面上添加代码进行设置: 先用getBytes()方法读出数据,然后再new String()方法设置格式为“utf ...

  7. python 导出mongoDB数据中的数据

    import pymongo,urllibimport sysimport timeimport datetimereload(sys)sys.setdefaultencoding('utf8')fr ...

  8. 其它课程中的python---5、Pandas处理数据和读取数据

    其它课程中的python---5.Pandas处理数据和读取数据 一.总结 一句话总结: 记常用和特例:慢慢慢慢的就熟了,不用太着急,慢慢来 库的使用都很简单:就是库的常用函数就这几个,后面用的时候学 ...

  9. 机器学习实战基础(十五):sklearn中的数据预处理和特征工程(八)特征选择 之 Filter过滤法(二) 相关性过滤

    相关性过滤 方差挑选完毕之后,我们就要考虑下一个问题:相关性了. 我们希望选出与标签相关且有意义的特征,因为这样的特征能够为我们提供大量信息.如果特征与标签无关,那只会白白浪费我们的计算内存,可能还会 ...

随机推荐

  1. 安卓手机上微信无法打开Https网址的完美解决方案

    1,第三方网站检测网站的SSL证书是否正确的安装 https://www.geocerts.com/ssl-checker,大概率你会看到下边的场景,一个证书链完整的警告,如果想知道我的基础配置是什么 ...

  2. 机器学习理论基础学习3.2--- Linear classification 线性分类之线性判别分析(LDA)

    在学习LDA之前,有必要将其自然语言处理领域的LDA区别开来,在自然语言处理领域, LDA是隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),是一种处理文档的主题 ...

  3. 1.keras实现-->使用预训练的卷积神经网络(VGG16)

    VGG16内置于Keras,可以通过keras.applications模块中导入. --------------------------------------------------------将 ...

  4. OAuth 白话简明教程 3.客户端模式(Client Credentials)

    转自:http://www.cftea.com/c/2016/11/6704.asp OAuth 白话简明教程 1.简述 OAuth 白话简明教程 2.授权码模式(Authorization Code ...

  5. 025-du命令查看文件大小

    1.查看某个目录下面所有文件占用空间大小并排序.du -sh  目录 2.排序.sort -h

  6. css rgba透明度变化

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  7. jms应用

    构建jms http://blog.csdn.net/haoxingfeng/article/details/9167895

  8. Java性能优化——HashCode的使用

    背景 告警子系统监控4万个大网元所有端口的某些指标数据,根据阈值配置判断是否产生告警.采集——数据处理子系统每5分钟会主动采集24万次数据,发送24万条消息给告警子系统,这24万条消息涉及100万实体 ...

  9. 论文笔记之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》

    1. 文章内容概述 本人精读了事件抽取领域的经典论文<Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networ ...

  10. Java代码质量度量工具大阅兵

    FindBugs FindBugs, a program which uses static analysis to look for bugs in Java code. It is free so ...