Python 数据分析：Pandas 缺省值的判断

背景

我们从数据库中取出数据存入 Pandas None 转换成 NaN 或 NaT。但是，我们将 Pandas 数据写入数据库时又需要转换成 None，不然就会报错。因此，我们就需要处理 Pandas 的缺省值。

样本数据

   id         name  password  sn  sex  age  amount  content  remark  login_date login_at    created_at

0   1  123456789.0       NaN NaN  NaN   20     NaN      NaN     NaN  NaN        NaT         2019-08-10 10:00:00

1   2          NaN       NaN NaN  NaN   20     NaN      NaN     NaN  NaN        NaT         2019-08-10 10:00:00

判断缺省值

如果 column 是缺省值，则统一处理为 None。

def judge_null(column):

    if pd.isnull(column):

        return None

    return column

处理缺省值

按列处理缺省值。

df['id'] = df.apply(lambda row: judge_null(row['id']), axis=1)

df['name'] = df.apply(lambda row: judge_null(row['name']), axis=1)

df['password'] = df.apply(lambda row: judge_null(row['password']), axis=1)

df['sn'] = df.apply(lambda row: judge_null(row['sn']), axis=1)

df['sex'] = df.apply(lambda row: judge_null(row['sex']), axis=1)

df['age'] = df.apply(lambda row: judge_null(row['age']), axis=1)

df['amount'] = df.apply(lambda row: judge_null(row['amount']), axis=1)

df['content'] = df.apply(lambda row: judge_null(row['content']), axis=1)

df['remark'] = df.apply(lambda row: judge_null(row['remark']), axis=1)

df['login_date'] = df.apply(lambda row: judge_null(row['login_date']), axis=1)

df['login_at'] = df.apply(lambda row: judge_null(row['login_at']), axis=1)

df['created_at'] = df.apply(lambda row: judge_null(row['created_at']), axis=1)

处理完成之后的数据

   id         name  password  sn    sex    age   amount    content  remark  login_date  login_at  created_at

0   1  123456789.0      None  None  None   20    None      None     None    None        None      2019-08-10 10:00:00

1   2         None      None  None  None   20    None      None     None    None        None      2019-08-10 10:00:00

补充

设置显示所有的行、列及值得长度。

# 显示所有列

pd.set_option('display.max_columns', None)

# 显示所有行

pd.set_option('display.max_rows', None)

# 设置value的显示长度为100，默认为50

pd.set_option('max_colwidth', 100)

对应的数据库建表语句

create table test

(

  id         int(10)        not null primary key,

  name       varchar(32)    null,

  password   char(10)       null,

  sn         bigint         null,

  sex        tinyint(1)     null,

  age        int(5)         null,

  amount     decimal(10, 2) null,

  content    text           null,

  remark     json           null,

  login_date date           null,

  login_at   datetime       null,

  created_at timestamp      null

);

Python 数据分析：Pandas 缺省值的判断的更多相关文章

Python数据分析--Pandas知识点(三)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, ...
Python数据分析--Pandas知识点(二)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算新建一个数据表 ...
Python数据分析-Pandas（Series与DataFrame）
Pandas介绍: pandas是一个强大的Python数据分析的工具包,是基于NumPy构建的. Pandas的主要功能: 1)具备对其功能的数据结构DataFrame.Series 2)集成时间序 ...
Python数据分析Pandas库数据结构(一)
pandas数据结构 1.生成一维矩阵模拟数据 import pandas as pdimport numpy as nps = pd.Series([1,2,3,4,np.nan,9,9])s2 = ...
python 数据分析--pandas
接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利用pandas的DataFrames进行统计分析 ...
Python数据分析Pandas库方法简介
Pandas 入门 Pandas简介背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...
Python数据分析Pandas库之熊猫(10分钟二)
pandas 10分钟教程(二) 重点发法分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...
Python数据分析Pandas库之熊猫(10分钟一)
pandas熊猫10分钟教程排序 df.sort_index(axis=0/1,ascending=False/True) df.sort_values(by='列名') import numpy ...
Python数据分析中对重复值、缺失值、空格的处理
对重复值的处理把数据结构中,行相同的数据只保留一行函数语法: drop_duplicates() from pandas import read_csv df = read_csv(文件位置) n ...

随机推荐

简单配置prometheus
一,物理节点安装配置(简单配置,未涉及报警及grafana图形展示) 1,prometheus 官网下载安装下载安装 # pwd /usr/local/src https://github.com/ ...
一些 sql 调优的总结
一.sql 优化方案 1)列类型尽量定义成数值类型,且长度尽可能短,如主键和外键,类型字段等等 2)建立单列索引 3)根据需要建立多列联合索引.当单个列过滤之后还有很多数据,那么索引的效率将会 ...
Jprofiler远程监控JVM
一.下载并安装本地和远程服务器分别安装Jprofiler,下载地址二.Windows远程连接JVM配置 1.打开Windows客户端Jprofiler 2.点Cancel 3.创建远程会话 4.添 ...
React曾经忽略的知识点（下）
1.JSX渲染想让类似 false.true.null 或 undefined 出现在输出中,你必须先把它转换成字符串 : <div> My JavaScript variable is ...
14 补充 MySQL的创建用户和授权
权限管理我们知道我们的最高权限管理者是root用户,它拥有着最高的权限操作.包括select.update.delete.update.grant等操作.那么一般情况在公司之后DBA工程师会创建一个 ...
java应用cpu使用率过高问题排查
---------------------------------------linux下如何定位代码问题------------------------------- 1.先通过top命令找到消耗c ...
异步任务分发模块Celery
Celery简介 Celery是一个功能完备即插即用的任务队列.它使得我们不需要考虑复杂的问题,使用非常简单. celery适用异步处理问题,当遇到发送邮件.或者文件上传, 图像处理等等一些比较耗时的 ...
tensorflow源码分析——CTC
CTC是2006年的论文Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurren ...
ifram刷新父窗口中内嵌页面
如果C的iframe标签的id是"iframec",那么在B.aspx中你想刷新的代码处写 parent.document.getElementById('iframec').sr ...
二：flask-debug模式详解
debug模式的情况下可以抛出详细异常信息新建一个脚本并运行访问此时是非debug模式,如果运行的时候代码报错了,是不会提示详细错误的,只会报服务器内部错误开启debug模式,可以查看到详细错 ...

Python 数据分析：Pandas 缺省值的判断

Python 数据分析：Pandas 缺省值的判断

背景

样本数据

判断缺省值

处理缺省值

处理完成之后的数据

补充

Python 数据分析：Pandas 缺省值的判断的更多相关文章

随机推荐

热门专题