fillna()函数
method: pad/ffill:用前一个非缺失值去填充该缺失值,用左边的非缺失值去填充该缺失值
backfill/bfill:用下一个非缺失值填充该缺失值,用右边的非缺失值去填充该缺失值
None:指定一个值去替换缺失值(默认这种方式)
limit参数:限制填充个数
axis参数:修改填充方向,默认为纵向填充,axis=1的时候,横向填充
import numpy as np
df = pd.DataFrame( [[np.nan,2,np.nan,np.nan],
[3,4,88,np.nan],
[np.nan,np.nan,np.nan,'k'],
[np.nan,3,np.nan,np.nan]],
columns=list('ABCD'))
print(df)
print(df.fillna(100)) # 用常数填充
print(df.fillna({'A':'这是第一列的填充值'}))# 字典填充
print(df.fillna(method='backfill')) # 同bfill
print(df.fillna(method='pad')) # 同ffill
print(df.fillna(method='pad', limit=1)) # limit限制了只填充一个
print(df.fillna(method='pad', axis=1)) # axis为1时,横向填充
# A B C D
# 0 NaN 2.0 NaN NaN
# 1 3.0 4.0 88.0 NaN
# 2 NaN NaN NaN k
# 3 NaN 3.0 NaN NaN
# A B C D
# 0 100.0 2.0 100.0 100
# 1 3.0 4.0 88.0 100
# 2 100.0 100.0 100.0 k
# 3 100.0 3.0 100.0 100
# A B C D
# 0 这是第一列的填充值 2.0 NaN NaN
# 1 3 4.0 88.0 NaN
# 2 这是第一列的填充值 NaN NaN k
# 3 这是第一列的填充值 3.0 NaN NaN
# A B C D
# 0 3.0 2.0 88.0 k
# 1 3.0 4.0 88.0 k
# 2 NaN 3.0 NaN k
# 3 NaN 3.0 NaN NaN
# A B C D
# 0 NaN 2.0 NaN NaN
# 1 3.0 4.0 88.0 NaN
# 2 3.0 4.0 88.0 k
# 3 3.0 3.0 88.0 k
# A B C D
# 0 NaN 2.0 NaN NaN
# 1 3.0 4.0 88.0 NaN
# 2 3.0 4.0 88.0 k
# 3 NaN 3.0 NaN k
# A B C D
# 0 NaN 2 2 2
# 1 3 4 88 88
# 2 NaN NaN NaN k
# 3 NaN 3 3 3
参考:https://blog.csdn.net/weixin_39549734/article/details/81221276
源码:
1 def fillna(self, value=None, method=None, axis=None, inplace=False,
2 limit=None, downcast=None, **kwargs):
3 return super(DataFrame,
4 self).fillna(value=value, method=method, axis=axis,
5 inplace=inplace, limit=limit,
6 downcast=downcast, **kwargs)
7
8 @Appender(_shared_docs['shift'] % _shared_doc_kwargs)
fillna()函数的更多相关文章
- fillna()
将下面注释掉 fillna() 函数:有一个inplace参数,默认为false,不会对原来dataframe中进行替换,为True时候会修改原来的.
- 从Excel到Python:最常用的36个Pandas函数
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两 ...
- 关于Excel,你一定用的到的36个Python函数
从Excel到Python:最常用的36个Pandas函数关于Excel,你一定用的到的36个Python函数 本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗 ...
- 利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
- 【转载】使用pandas进行数据清洗
使用pandas进行数据清洗 本文转载自:蓝鲸的网站分析笔记 原文链接:使用python进行数据清洗 目录: 数据表中的重复值 duplicated() drop_duplicated() 数据表中的 ...
- Python【8】-分析json文件
一.本节用到的基础知识 1.逐行读取文件 for line in open('E:\Demo\python\json.txt'): print line 2.解析json字符串 Python中有一些内 ...
- Python数据分析之pandas学习
Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利 ...
- Python 数据分析(一) 本实验将学习 pandas 基础,数据加载、存储与文件格式,数据规整化,绘图和可视化的知识
第1节 pandas 回顾 第2节 读写文本格式的数据 第3节 使用 HTML 和 Web API 第4节 使用数据库 第5节 合并数据集 第6节 重塑和轴向旋转 第7节 数据转换 第8节 字符串操作 ...
- pandas处理丢失数据-【老鱼学pandas】
假设我们的数据集中有缺失值,该如何进行处理呢? 丢弃缺失值的行或列 首先我们定义了数据集的缺失值: import pandas as pd import numpy as np dates = pd. ...
随机推荐
- 使用GET与POST方式获取html数据
抓取网站数据解析的工作,其中,使用到GET和POST方法获取html数据. 使用GET方式: /** * 使用get方式获取html数据 * * @param strURL(需要访问的网站) * @r ...
- Java组合算法
这是一个简单的问题,大一刚学编程的时候做的笔记. 打印出从1.2.3……n中取出r个数的不同组合(n>=r>=1) 例如n=3,r=2,输出: 1,2 2,3 下面是实现的代码: publ ...
- ubuntu14.04首次安装.md
ubuntu14.04 安装后的工作 1.换软件源 sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup 网易163更新服务器(广东广州 ...
- PAT Basic 1046 划拳 (15 分)
划拳是古老中国酒文化的一个有趣的组成部分.酒桌上两人划拳的方法为:每人口中喊出一个数字,同时用手比划出一个数字.如果谁比划出的数字正好等于两人喊出的数字之和,谁就赢了,输家罚一杯酒.两人同赢或两人同输 ...
- devicetree推荐教程
https://www.cnblogs.com/aaronLinux/p/5496559.html
- 真正解决iframe高度自适应问题
1.前言 解决iframe高度自适应问题有两种方法1.pym2.手动设置iframe的高度 本文主要是总结第二种实现方式,因为第一种pym.js插件我没用懂 如果使用iframe时,遇到以下的需求: ...
- 在Wi-Fi路由器中发现了新的安全漏洞
黑客利用两种互联网通用协议的互动的漏洞:传输控制协议,或TCP和Wi-Fi.该漏洞利用并不针对任何传统的安全漏洞.相反,安全方面的弱点在于20多年前制定的基本Wi-Fi设计决策极难改变. 中国黑客教父 ...
- 缓存算法LRU笔记
LRU原理与分析 LRU是Least Recently Used 的缩写,翻译过来就是“最近最少使用”,也就是说,LRU缓存把最近最少使用的数据移除,让给最新读取的数据.而往往最常读取的,也是读取 ...
- 【leetcode】410. Split Array Largest Sum
题目如下: Given an array which consists of non-negative integers and an integer m, you can split the arr ...
- LTE系统时延及降低空口时延的4种方案
转载:https://rf.eefocus.com/article/id-LTE%20delay 对于移动通信业务而言,最重要的时延是端到端时延, 即对于已经建立连接的收发两端,数据包从发送端产生,到 ...