Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分

先设定好我们的dataframe：

# pandas 设置特定的值

dates=pd.date_range('',periods=6)

# print(dates)

df=pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d'])

print(df)

结果：

             a   b   c   d

2013-01-01   0   1   2   3

2013-01-02   4   5   6   7

2013-01-03   8   9  10  11

2013-01-04  12  13  14  15

2013-01-05  16  17  18  19

2013-01-06  20  21  22  23

一、修改特定的数据

1.1分别根据索引和行（列）号来修改特定的值

df.iloc[2,2]=1111 #第二列第二行的数据 改为1111

print(df)

df.loc['','b']=2222

print(df)

结果：

             a     b     c   d

2013-01-01   0  2222     2   3

2013-01-02   4     5     6   7

2013-01-03   8     9  1111  11

2013-01-04  12    13    14  15

2013-01-05  16    17    18  19

2013-01-06  20    21    22  23

1.2对特定的行进行筛选操作

df[df.a>4]=0 #这个是指 a这一列 只要是大于4的 其所在的行全部变为0

print(df)

结果：

            a  b  c  d

2013-01-01  0  1  2  3

2013-01-02  4  5  6  7

2013-01-03  0  0  0  0

2013-01-04  0  0  0  0

2013-01-05  0  0  0  0

2013-01-06  0  0  0  0

1.3对特定的列进行筛选操作：

df.a[df.a>4]=0#这个是只更改某一列

print(df)

结果

            a   b   c   d

2013-01-01  0   1   2   3

2013-01-02  4   5   6   7

2013-01-03  0   9  10  11

2013-01-04  0  13  14  15

2013-01-05  0  17  18  19

2013-01-06  0  21  22  23

二、增加一个列

#datafame 加一个空的行

df['f']=np.nan

print(df)

#这个是增加一个有内容的行

df['e']=pd.Series([1,2,3,4,5,6],index=pd.date_range('',periods=6))

print(df)

结果：

             a   b   c   d   f  e

2013-01-01   0   1   2   3 NaN  1

2013-01-02   4   5   6   7 NaN  2

2013-01-03   8   9  10  11 NaN  3

2013-01-04  12  13  14  15 NaN  4

2013-01-05  16  17  18  19 NaN  5

2013-01-06  20  21  22  23 NaN  6

三、处理没有数据的部分

3.1设定丢失数据

# pandas处理没有数据的部分

dates=pd.date_range('',periods=6)

# print(dates)

df=pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d'])

print(df)

df.iloc[0,1]=np.nan#设定丢失的数据

df.iloc[1,2]=np.nan

print(df)

结果：

             a     b     c   d

2013-01-01   0   NaN   2.0   3

2013-01-02   4   5.0   NaN   7

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

3.2丢弃操作

丢弃特定的行

df=df.dropna(axis=0,how='any')#axis=0 表示行 how={'any','all'}

print(df)

结果

             a     b     c   d

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

丢弃特定的列：

df=df.dropna(axis=1,how='any')

print(df)

结果

             a   d

2013-01-01   0   3

2013-01-02   4   7

2013-01-03   8  11

2013-01-04  12  15

2013-01-05  16  19

2013-01-06  20  23

填充操作：

# 填充操作

df=df.fillna(value=2333)

print(df)

结果：

             a       b       c   d

2013-01-01   0  2333.0     2.0   3

2013-01-02   4     5.0  2333.0   7

2013-01-03   8     9.0    10.0  11

2013-01-04  12    13.0    14.0  15

2013-01-05  16    17.0    18.0  19

2013-01-06  20    21.0    22.0  23

四、判断是否有缺失

# 判断是否有缺失

df=df.isnull()

print(df)

a=np.any(df.isnull()==True)

print(a)

结果：

                a      b      c      d

2013-01-01  False   True  False  False

2013-01-02  False  False   True  False

2013-01-03  False  False  False  False

2013-01-04  False  False  False  False

2013-01-05  False  False  False  False

2013-01-06  False  False  False  False

直接确定是否有缺失的

True

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分的更多相关文章

Qt 学习之路 2（57）：可视化显示数据库数据
Qt 学习之路 2(57):可视化显示数据库数据(skip) 豆子 2013年6月26日 Qt 学习之路 2 26条评论前面我们用了两个章节介绍了 Qt 提供的两种操作数据库的方法.显然,使用QSq ...
大数据学习之路又之从小白到用sqoop导出数据
写这篇文章的目的是总结自己学习大数据的经验,以为自己走了很多弯路,从迷茫到清晰,真的花费了很多时间,希望这篇文章能帮助到后面学习的人. 一.配置思路安装linux虚拟机--->创建三台虚拟机- ...
Mysql数据表字段设置了默认值，插入数据后默认字段的值却为null，不是默认值
我将mysql的数据表的某个字段设置了默认值为1,当向该表插入数据的时候该字段的值不是默认值,而是null. 我的错误原因: 对数据库的操作我使用了持久化工具mybatis,插入数据的时候插入的是整个 ...
Panda的学习之路（2）——pandas选择数据
首先定义panda dates=pd.date_range(',periods=6) # print(dates) df=pd.DataFrame(np.arange(24).reshape(6,4) ...
Panda的学习之路（1）——series 和 Dataframe
一.Series panda最基本的对象 # pandas的基础s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象类似一个一位数组print("建立个简 ...
Android学习之路——Android四大组件之activity（二）数据的传递
上一篇讲了activity的创建和启动,这一篇,我们来讲讲activity的数据传递 activity之间的数据传递,这里主要介绍的是activity之间简单数据的传递,直接用bundle传递基本数据 ...
Spark学习之路（九）SparkCore的调优之数据倾斜调优
摘抄自:https://tech.meituan.com/spark-tuning-pro.html 数据倾斜调优调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Sp ...
Spark学习之路（九）SparkCore的调优之数据倾斜调优[转]
调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题--数据倾斜,此时Spark作业的性能会比期望差很多.数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的 ...
IOS开发---菜鸟学习之路--（十三）-利用MBProgressHUD进行异步获取数据
本章将介绍如何利用MBProgressHUD实现异步处理数据. 其实我本来只是像实现一个加载数据时提示框的效果,然后问了学长知道了这个类,然后就使用了接着就发现了一个“BUG” 再然后就发现原来MB ...

随机推荐

eclipse 项目的创建编写 'Hello World'
写项目之前确保 eclipse 安装完成以及JDK 环境配置成功开始: 打开eclipse 右键file ->new->java project 如图: 然后输入项目名点击Fin ...
[AtCoder Code Festival 2017 QualB C/At3574] 3 Steps - 二分图染色,结论
给你一个n个点m条边的无向图,进行以下操作如果存在两个点u和v,使得从u走三步能恰好到达v,那么在u和v之间连接一条边重复这个操作直到不能再连接新的边,问最后有多少条边? n, m <= 1 ...
navicat异常 - 1130-host ... is not allowed to connect to this MySql server
错误描述用navicat连接数据库报错:1130-host ... is not allowed to connect to this MySql server如何处理解决方案 1.连接服务器: ...
Oracle监听出现的问题总结，以及解决办法
包括的错误类型: 1.ORA-12541: TNS: 无监听程序 2. ORA-12514: TNS: 监听程序当前无法识别连接描述符中请求的服务 3.ORA-12560: TNS: 协议适配器错误 ...
Python 查看函数属于哪个模块
help(函数名)出现的信息里包含了所在模块
AE开发常见问题总结
一. Arcgis10.0 组件初始化失败解决方法: ESRI.ArcGIS.RuntimeManager.BindLicense(ESRI.ArcGIS.ProductCode.EngineOrDe ...
关于按下ctrl+z后，之后的cin失效的问题
下面这代码按下Ctrl+z结束while输入后,接下来的cin >> val2就无法输入了 #include <iostream> #include <vector> ...
EF CodeFirst关于Mysql如何自动生成数据库表
相对于sqlserver数据库,mysql的配置过程相对麻烦一些,我们从0讲起. 1.新建一个控制台应用程序右键点击引用--管理NuGet程序包,搜索Mysql.Data.Entity并安装,安装完 ...
leetcode 925. Long Pressed Name
判定是否长按 var isLongPressedName = function (name, typed) { var i = 1, j = 0, n = name.length, m = typed ...
asp.net使用wsdl文件调用接口，以及调用SSL接口报错“根据验证过程远程证书无效”的处理
1.调用wsdl接口,首先需要将wsdl文件转换为cs文件: 进入VS 开发人员命令提示行,输入如下命令: c:/Program Files/Microsoft Visual Studio 8/VC& ...

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分的更多相关文章

随机推荐

热门专题