Python笔记 #15# Pandas: Missing Data
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt dates = pd.date_range('', periods=3) # 创建 16 17 18 等六个日期 df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list('ABCD')) # 这是二维的,类似于一个
df1 = df.reindex(index=dates[0:3], columns=list(df.columns) + ['E'])
df1.loc[dates[0]:dates[1],'E'] = 1
# print(df1)
# A B C D E
# 2018-01-16 -0.183828 1.393147 1.816151 0.595298 1.0
# 2018-01-17 1.118642 -0.106566 -0.213438 1.510072 1.0
# 2018-01-18 0.705483 1.629647 -1.657045 0.428885 NaN
# pandas 用 np.nan 来表示 missing data # print(df1.dropna(how='any')) # 所以这个方法不改变内部哦 ~ 但是会返回一个删除所有含 NaN 的行的 dataframe
# print(df1)
# A B C D E
# 2018-01-16 0.866927 0.918359 0.908967 -0.888321 1.0
# 2018-01-17 -0.446272 0.534636 -0.160422 -0.157928 1.0
# A B C D E
# 2018-01-16 0.866927 0.918359 0.908967 -0.888321 1.0
# 2018-01-17 -0.446272 0.534636 -0.160422 -0.157928 1.0
# 2018-01-18 1.095823 -1.300827 0.746324 -0.277497 NaN
# 填充 NaN
# print(df1.fillna(value=5)) # 这个也是不改变“本尊”的!
# print(df1)
# A B C D E
# 2018-01-16 0.286535 -0.847836 -0.949535 -1.889351 1.0
# 2018-01-17 -0.530458 -0.871814 1.169275 0.337444 1.0
# 2018-01-18 -0.457999 -0.325463 0.439679 -0.104462 5.0
# A B C D E
# 2018-01-16 0.286535 -0.847836 -0.949535 -1.889351 1.0
# 2018-01-17 -0.530458 -0.871814 1.169275 0.337444 1.0
# 2018-01-18 -0.457999 -0.325463 0.439679 -0.104462 NaN # To get the boolean mask where values are nan
# print(pd.isna(df1))
# A B C D E
# 2018-01-16 False False False False False
# 2018-01-17 False False False False False
# 2018-01-18 False False False False True
Python笔记 #15# Pandas: Missing Data的更多相关文章
- Python笔记 #13# Pandas: Viewing Data
感觉很详细:数据分析:pandas 基础 import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...
- Python笔记 #18# Pandas: Grouping
10 Minutes to pandas 引 By “group by” we are referring to a process involving one or more of the foll ...
- Python笔记 #16# Pandas: Operations
10 Minutes to pandas #Stats # shift 这玩意儿有啥用??? s = pd.Series([1,5,np.nan], index=dates).shift(0) # s ...
- Python笔记 #14# Pandas: Selection
10 Minutes to pandas import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...
- Python笔记 #17# Pandas: Merge
10 Minutes to pandas Concat df = pd.DataFrame(np.random.randn(10, 4)) print(df) # break it into piec ...
- python笔记15
今日内容 模块知识 内置模块 time datetime json 其他 内容回顾 & 作业题 重要知识点 构造字典和函数对应关系,避免重复的if else a=1 b=2 ==> a, ...
- 【Python笔记】十分钟搞定pandas
本文是对pandas官方网站上<10 Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯 ...
- Python pandas.io.data 模块迁移
这段时间用pandas做数据分析, import pandas.io.data as web 然后得到下面的错误提示 "The pandas.io.data module is moved ...
- 学习笔记之pandas
Python Data Analysis Library — pandas: Python Data Analysis Library https://pandas.pydata.org/ panda ...
随机推荐
- NUC970 U-Boot 使用說明
U-Boot 使用說明U-Boot 是一個主要用於嵌入式系統的開機載入程式, 可以支援多種不同的計算機系統結構, 包括ARM.MIPS.x86與 68K. 這也是一套在GNU通用公共許可證之下發布的自 ...
- Runtime 运行时之一:类与对象
Objective-C语言是一门动态语言,它将很多静态语言在编译和链接时期做的事放到了运行时来处理.这种动态语言的优势在于:我们写代码时能够更具灵活性,如我们可以把消息转发给我们想要的对象,或者随意交 ...
- 【TP3.2】 动态切换数据库方法
1 config 配置: 'connection' => 'mysql://root:root@localhost:3306/dbname', connection 数据库连接字符串,后面代码 ...
- js实现表单项的全选、反选以及删除操作
<html> <head> <title>test</title> <script language="javascript" ...
- 深入浅出Docker(六):像谷歌一样部署你的应用
1.概述 谷歌发起的开源项目从来都是广受技术圈的关注和讨论,本文将介绍的就是最新的容器编排管理系统Kubernetes.Kubernetes开源项目版本更新频繁,对于初次使用者来说其定义大量的技术术语 ...
- chrome中image图片预留位置的问题
在项目中发现,当设置 <img src="" width="100" height="100"> 通过设置img的width属性 ...
- 兼容ie8的框架
layui Flow-UI http://refined-x.com/Flow-UI/
- AOP学习总结
参考:什么是AOP? OOP引入封装.继承和多态性等概念来建立一种对象层次结构,用以模拟公共行为的一个集合.当我们需要为分散的对象引入公共行为的时候,OOP则显得无能为力.也就是说,OOP允许你定义从 ...
- SHTML 教程
什么是 SHTML 使用SSI(Server Side Include)的html文件扩展名,SSI(Server Side Include),通常称为“服务器端嵌入”或者叫“服务器端包含”,是一种类 ...
- Android dialog 全屏
Android中让Dialog全屏: 一.在style中定义样式: <?xml version="1.0" encoding="utf-8"?> & ...