Python笔记 #15# Pandas: Missing Data
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt dates = pd.date_range('', periods=3) # 创建 16 17 18 等六个日期 df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list('ABCD')) # 这是二维的,类似于一个
df1 = df.reindex(index=dates[0:3], columns=list(df.columns) + ['E'])
df1.loc[dates[0]:dates[1],'E'] = 1
# print(df1)
# A B C D E
# 2018-01-16 -0.183828 1.393147 1.816151 0.595298 1.0
# 2018-01-17 1.118642 -0.106566 -0.213438 1.510072 1.0
# 2018-01-18 0.705483 1.629647 -1.657045 0.428885 NaN
# pandas 用 np.nan 来表示 missing data # print(df1.dropna(how='any')) # 所以这个方法不改变内部哦 ~ 但是会返回一个删除所有含 NaN 的行的 dataframe
# print(df1)
# A B C D E
# 2018-01-16 0.866927 0.918359 0.908967 -0.888321 1.0
# 2018-01-17 -0.446272 0.534636 -0.160422 -0.157928 1.0
# A B C D E
# 2018-01-16 0.866927 0.918359 0.908967 -0.888321 1.0
# 2018-01-17 -0.446272 0.534636 -0.160422 -0.157928 1.0
# 2018-01-18 1.095823 -1.300827 0.746324 -0.277497 NaN
# 填充 NaN
# print(df1.fillna(value=5)) # 这个也是不改变“本尊”的!
# print(df1)
# A B C D E
# 2018-01-16 0.286535 -0.847836 -0.949535 -1.889351 1.0
# 2018-01-17 -0.530458 -0.871814 1.169275 0.337444 1.0
# 2018-01-18 -0.457999 -0.325463 0.439679 -0.104462 5.0
# A B C D E
# 2018-01-16 0.286535 -0.847836 -0.949535 -1.889351 1.0
# 2018-01-17 -0.530458 -0.871814 1.169275 0.337444 1.0
# 2018-01-18 -0.457999 -0.325463 0.439679 -0.104462 NaN # To get the boolean mask where values are nan
# print(pd.isna(df1))
# A B C D E
# 2018-01-16 False False False False False
# 2018-01-17 False False False False False
# 2018-01-18 False False False False True
Python笔记 #15# Pandas: Missing Data的更多相关文章
- Python笔记 #13# Pandas: Viewing Data
感觉很详细:数据分析:pandas 基础 import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...
- Python笔记 #18# Pandas: Grouping
10 Minutes to pandas 引 By “group by” we are referring to a process involving one or more of the foll ...
- Python笔记 #16# Pandas: Operations
10 Minutes to pandas #Stats # shift 这玩意儿有啥用??? s = pd.Series([1,5,np.nan], index=dates).shift(0) # s ...
- Python笔记 #14# Pandas: Selection
10 Minutes to pandas import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = ...
- Python笔记 #17# Pandas: Merge
10 Minutes to pandas Concat df = pd.DataFrame(np.random.randn(10, 4)) print(df) # break it into piec ...
- python笔记15
今日内容 模块知识 内置模块 time datetime json 其他 内容回顾 & 作业题 重要知识点 构造字典和函数对应关系,避免重复的if else a=1 b=2 ==> a, ...
- 【Python笔记】十分钟搞定pandas
本文是对pandas官方网站上<10 Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯 ...
- Python pandas.io.data 模块迁移
这段时间用pandas做数据分析, import pandas.io.data as web 然后得到下面的错误提示 "The pandas.io.data module is moved ...
- 学习笔记之pandas
Python Data Analysis Library — pandas: Python Data Analysis Library https://pandas.pydata.org/ panda ...
随机推荐
- centos solr4.5 tomcat 简单安装[已测试ok]
一.环境准备: 1.jdk安装 2.tomcat安装 这两个基本环境的安装在这里就不说了 二.下载solr-4.5.0.tgz 三.安装solr 1.解压solr tar -zxvf /opt/sol ...
- Android AndroidManifest.xml配置文件
AndroidManifest.xml配置文件介绍本质:AndroidManifest.xml是整个应用的主配置清单文件.包含:该应用的包名.版本号.组件.权限等信息.作用:记录该应用的相关配置信息. ...
- android基础组件---->Checkboxe的使用
由于使用比较简单,这篇博客涵盖Checkboxes和Radio Buttons和Toggle Buttons.好了我们开始今天的学习.我被世俗隐瞒,转身又被自己撞倒.从莫须有的罪名起步,行色简单,心术 ...
- Dell、IBM服务器配置远程管理卡
author: headsen chen date: 2018-10-09 14:12:32 1,IBM的服务器: 需要在bios里边进行配置,具体配置如下: , 开机画面过完之后,按F1进入bio ...
- iOS CoreMotion 纪录步数
- (void)startUpdateAccelerometer{ /* 设置采样的频率,单位是秒 */ NSTimeInterval updateInterval = 0.05; // ...
- DES加密解密 Java中运用
DES全称Data Encryption Standard,是一种使用密匙加密的块算法.现在认为是一种不安全的加密算法,因为现在已经有用穷举法攻破DES密码的报道了.尽管如此,该加密算法还是运用非常普 ...
- MySQL Server has gone away报错原因汇总分析(转自:http://cenalulu.github.io/mysql/mysql-has-gone-away/)
原因1. MySQL 服务宕了 判断是否属于这个原因的方法很简单,执行以下命令,查看mysql的运行时长 $ mysql -uroot -p -e "show global status l ...
- Hadoop命令别名
[hadoop@master ~]$ alias hdfs='hadoop dfs' [hadoop@master ~]$ hdfs -ls / drwxrwxr-x - hadoop super ...
- 无向连通图求割点(tarjan算法去掉改割点剩下的联通分量数目)
poj2117 Electricity Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 3603 Accepted: 12 ...
- 'Settings' object has no attribute 'TEMPLATE_DEBUG' 的解决方法
找到该Django项目下的settings文件,把 DEBUG = True 改为 DEBUG = False 就可以正常浏览显示了 参考:https://stackoverflow.com/ques ...