pandas 处理数据中NaN数据

使用dropna（）函数去掉NaN的行或列

import pandas as pd

import pickle

import numpy as np

dates = pd.date_range('', periods=)

df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])

df.iloc[,]=np.nan

df.iloc[,]=np.nan

print(df)

print(df.dropna(axis=,how='any'))

输出：

             A     B     C   D

--      NaN   2.0

--      5.0   NaN

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

             A     B     C   D

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

使用fillna（）函数替换NaN值

import pandas as pd

import pickle

import numpy as np

dates = pd.date_range('', periods=)

df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])

df.iloc[,]=np.nan

df.iloc[,]=np.nan

print(df)

#将NaN值替换为0

print(df.fillna(value=))

输出

             A     B     C   D

--      NaN   2.0

--      5.0   NaN

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

             A     B     C   D

--      0.0   2.0

--      5.0   0.0

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

使用isnull()函数判断数据是否丢失

import pandas as pd

import pickle

import numpy as np

dates = pd.date_range('', periods=)

df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])

df.iloc[,]=np.nan

df.iloc[,]=np.nan

print(df)

#矩阵用布尔来进行表示 是nan为ture 不是nan为false

print(pd.isnull(df))

输出

             A     B     C   D

--      NaN   2.0

--      5.0   NaN

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

                A      B      C      D

--  False   True  False  False

--  False  False   True  False

--  False  False  False  False

--  False  False  False  False

--  False  False  False  False

--  False  False  False  False

#判断数据中是否会存在NaN值

import pandas as pd

import pickle

import numpy as np

dates = pd.date_range('', periods=)

df = pd.DataFrame(np.arange().reshape((,)), index=dates, columns=['A', 'B', 'C', 'D'])

df.iloc[,]=np.nan

df.iloc[,]=np.nan

print(df)

#判断数据中是否会存在NaN值

print(np.any(df.isnull()))

输出

             A     B     C   D

--      NaN   2.0

--      5.0   NaN

--      9.0  10.0

--    13.0  14.0

--    17.0  18.0

--    21.0  22.0

True

pandas 处理数据中NaN数据的更多相关文章

返回数据中提取数据的方法（JSON数据取其中某一个值的方法）
返回数据中提取数据的方法比如下面的案例是,取店铺名称接口返回数据如下: {"Code":0,"Msg":"ok","Data& ...
深度学习原理与框架-CNN在文本分类的应用 1.tf.nn.embedding_lookup(根据索引数据从数据中取出数据) 2.saver.restore(加载sess参数)
1. tf.nn.embedding_lookup(W, X) W的维度为[len(vocabulary_list), 128], X的维度为[?, 8],组合后的维度为[?, 8, 128] 代码说 ...
pandas实现excel中的数据透视表和Vlookup函数功能
在孩子王实习中做的一个小工作,方便整理数据. 目前这几行代码是实现了一个数据透视表和匹配的功能,但是将做好的结果写入了不同的excel中, 如何实现将结果连续保存到同一个Excel的同一个工作表中?还 ...
pandas读取excel中指定数据的行数
shuju = pd.read_excel(filename) loandata = pd.DataFrame(shuju) ncol = (len(loandata.keys())) data = ...
java中如何从一行数据中读取数据
目录 @(如何从一行数据中切割数据) 例如我要从一行学生信息中分割出学号.姓名.年龄.学历等等 ==主要使用split方法,split方法在API中定义如下:== public String[] sp ...
JSP页面读取数据中的数据内容，出现乱码现象的解决方法
1.首先要确保JSP页面的编码已修改为“utf-8”的字符编码: 2.然后再在jsp页面上添加代码进行设置: 先用getBytes()方法读出数据,然后再new String()方法设置格式为“utf ...
python 导出mongoDB数据中的数据
import pymongo,urllibimport sysimport timeimport datetimereload(sys)sys.setdefaultencoding('utf8')fr ...
其它课程中的python---5、Pandas处理数据和读取数据
其它课程中的python---5.Pandas处理数据和读取数据一.总结一句话总结: 记常用和特例:慢慢慢慢的就熟了,不用太着急,慢慢来库的使用都很简单:就是库的常用函数就这几个,后面用的时候学 ...
机器学习实战基础（十五）：sklearn中的数据预处理和特征工程（八）特征选择之 Filter过滤法（二）相关性过滤
相关性过滤方差挑选完毕之后,我们就要考虑下一个问题:相关性了. 我们希望选出与标签相关且有意义的特征,因为这样的特征能够为我们提供大量信息.如果特征与标签无关,那只会白白浪费我们的计算内存,可能还会 ...

随机推荐

安卓手机上微信无法打开Https网址的完美解决方案
1,第三方网站检测网站的SSL证书是否正确的安装 https://www.geocerts.com/ssl-checker,大概率你会看到下边的场景,一个证书链完整的警告,如果想知道我的基础配置是什么 ...
机器学习理论基础学习3.2--- Linear classification 线性分类之线性判别分析(LDA)
在学习LDA之前,有必要将其自然语言处理领域的LDA区别开来,在自然语言处理领域, LDA是隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),是一种处理文档的主题 ...
1.keras实现-->使用预训练的卷积神经网络(VGG16)
VGG16内置于Keras,可以通过keras.applications模块中导入. --------------------------------------------------------将 ...
OAuth 白话简明教程 3.客户端模式（Client Credentials）
转自:http://www.cftea.com/c/2016/11/6704.asp OAuth 白话简明教程 1.简述 OAuth 白话简明教程 2.授权码模式(Authorization Code ...
025-du命令查看文件大小
1.查看某个目录下面所有文件占用空间大小并排序.du -sh 目录 2.排序.sort -h
css rgba透明度变化
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
jms应用
构建jms http://blog.csdn.net/haoxingfeng/article/details/9167895
Java性能优化——HashCode的使用
背景告警子系统监控4万个大网元所有端口的某些指标数据,根据阈值配置判断是否产生告警.采集——数据处理子系统每5分钟会主动采集24万次数据,发送24万条消息给告警子系统,这24万条消息涉及100万实体 ...
论文笔记之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》
1. 文章内容概述本人精读了事件抽取领域的经典论文<Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networ ...
Java代码质量度量工具大阅兵
FindBugs FindBugs, a program which uses static analysis to look for bugs in Java code. It is free so ...

pandas 处理数据中NaN数据

pandas 处理数据中NaN数据的更多相关文章

随机推荐

热门专题