pandas中Dataframe的一些用法

pandas读取excel文件

pd.read_excel 前提是安装xlrd库

dataframe，numpy，list之间的互相转换

dataframe转numpy ：dataframe对象.values
dataframe转list：dataframe对象.values.tolist()
list转numpy：np.array(list对象)
list转dataframe：pd.DataFrame(list对象)
numpy转list：numpy对象.tolist()
numpy转dataframe:pd.DataFrame(numpy对象)

dataframe 按行遍历，按列遍历

按行遍历:

常用df.iterrows()

import pandas as pd

demo_list = [[1,2],

             [3,4]]

#用list构建dataframe

demo_df = pd.DataFrame(demo_list)

print(demo_df)

#接上

for row in demo_df.iterrows():

	print(type(row))

    print(row[0])

    print(row[1])

可以看到每个row的类型是tuple元组类型，元组长度为2，元组第0个元素为index，第1个元素为横向的series。**值得注意的是，在遍历过程中如果取每一行的某个值，通过对row[1]进行切片即可。 **

按列遍历

经常使用df.columns获取列名然后访问

#接上

print(demo_df.columns)

for column in demo_df.columns:

    print(demo_df[column])

dataframe之使用iloc切片

先构建dataframe

import numpy as np

import pandas as pd

##list构建5x5的dataframe，由于dataframe没有reshape，因此需要借助numpy

demo_list = [i for i in range(25)]

demo_np = np.array(demo_list).reshape(5,5)

demo_df = pd.DataFrame(demo_list)

print(demo_df)

iloc[start:end ,start :end ]表示按行列取出dataframe的值。其中逗号前面表示行，逗号后面表示列。冒号左侧表示开始，冒号右侧表示结束(遵循左闭右开原则)。例如，demo_df.iloc[2:4,1:3]表示切片第二行到第三行第一列到第二列数据。切片返回的数据类型还是dataframe。

iloc[start: end :step,start:end :step]是在上一个切片的基础上加上了步长。表示从start到end每step步取一次值。

dataframe 中缺失值的处理

均值填充

通常使用fillna()

##获取存在缺失值的列名列表

null_columns=list(file_df.columns[file_df.isnull().sum() > 0])

for column in null_columns :

    #计算每一列的均值

	mean_val = file_df[column].mean()

	#使用fillna进行均值填充

    file_df[column].fillna(mean_val, inplace=True)

dataframe的一些用法的更多相关文章

DataFrame的apply用法
DataFrame的apply方法: def cal_value_percent(row,total_value): row['new_column']=row[estimated_value_col ...
python对dataframe的相关用法
1.选择列名包含特殊字符的列 d2 = d1.loc[:, d1.columns.str.contains('vib')] 2.选择列名开头为包含特殊字符的列 df2 = df1.loc[:, df1 ...
Pandas 基础(2) - Dataframe 基础
上一节我们已经对 Dataframe 的概念做了一个简单的介绍, 这一节将具体看下它的一些基本用法: 首先, 准备一个 excel 文件, 大致内容如下, 并保存成 .csv 格式. 然后, 在 ju ...
spark学习（1）---dataframe操作大全
一.dataframe操作大全 https://blog.csdn.net/dabokele/article/details/52802150 https://www.jianshu.com/p/00 ...
Spark实战电影点评系统(二)
二.通过DataFrame实战电影点评系统 DataFrameAPI是从Spark 1.3开始就有的,它是一种以RDD为基础的分布式无类型数据集,它的出现大幅度降低了普通Spark用户的学习门槛. D ...
spark自定义函数之——UDF使用详解及代码示例
前言本文介绍如何在Spark Sql和DataFrame中使用UDF,如何利用UDF给一个表或者一个DataFrame根据需求添加几列,并给出了旧版(Spark1.x)和新版(Spark2.x)完整 ...
PySpark 大数据处理
本文主要介绍Spark的一些基本算子,PySpark及Spark SQL 的使用方法. 虽然我从2014年就开始接触Spark,但几年来一直没有真正地学以致用,时间一久便忘了如何使用,直到在工作中用到 ...
pandas-03 DataFrame()中的iloc和loc用法
pandas-03 DataFrame()中的iloc和loc用法简单的说: iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[10:20, 3:5 ...
转化dataframe中一组序列为时间序列的方法-to_datetime()的最新用法
一.to_datetime()的最新用法: hs300_hf['date'] = pd.to_datetime(hs300_hf['date']) hs300_hf.set_index('date', ...

随机推荐

卷积神经网络图像纹理合成 Texture Synthesis Using Convolutional Neural Networks
代码实现概述这是关于Texture Synthesis Using Convolutional Neural Networks论文的tensorflow2.0代码实现,使用keras预训练的VGG ...
在 Spark 数据导入中的一些实践细节
本文由合合信息大数据团队柳佳浩撰写 1.前言图谱业务随着时间的推移愈发的复杂化,逐渐体现出了性能上的瓶颈:单机不足以支持更大的图谱.然而,从性能上来看,Neo4j 的原生图存储有着不可替代的性能优势 ...
如何调整MathType公式的字体大小
作为一名理科生,想必大家都在为编辑公式而烦恼,在Word中要想完美插入公式,还真不是那么简单的.首先要使用专业的公式编辑器MathType,其次还要对公式的大小进行修改,这样才能看起来是相融合的文章. ...
使用Camtasia创作抖音卡点视频
空闲的时候刷一刷抖音相信已经成为很多人的日常啦,抖音里面的视频形式多种多样,而其中的卡点视频更是被大家热烈追捧.如果你外出旅行拍摄了很多好看的照片,就很适合用卡点视频的形式展现出来. 如果你想要制作这 ...
思维导图软件iMindMap的使用方法
从手绘的思维导图再到各种各样的思维导图的软件,思维导图的高效性大家都体会到了.思维导图软件iMindMap在众多导图软件中是最受欢迎的之一,下面就给大家分享一下思维导图怎么画: 首先我要教给大家的是如 ...
uniapp兄弟组件如何修改数据？一看就废！
1. 如A组件里有个num = 10 并需要在生命周期函数created里通过uniapp提供的uni.$on方法来注册全局事件,并加一个形参.( uni.$on( '自定义事件名') , 形参 =& ...
宝塔Linux面板基础命令
安装宝塔Centos安装脚本 yum install -y wget && wget -O install.sh http://download.bt.cn/install/insta ...
try...catch的前世今生
1975年, John Goodenough发表论文,提出异常处理的建议: 一是明确声明命令可能抛出何种异常: 二是需要有将可能出错的操作括起来的语句结构. Communications of the ...
一枚程序猿的MacBook M1详细体验报告
前言 2020年11月11日双十一上午,苹果发布了M1芯片的新款Mac,其最大的变化就是将处理器从Intel换成了苹果自研的ARM芯片M1. 上一次苹果更换Mac芯片要追溯到2006年,14年前,苹果 ...
记一次用python 的ConfigParser读取配置文件编码报错
记一次用python 的ConfigParser读取配置文件编码报错 ...... raise MissingSectionHeaderError(fpname, lineno, line)Confi ...

dataframe的一些用法

pandas中Dataframe的一些用法

pandas读取excel文件

dataframe，numpy，list之间的互相转换

dataframe 按行遍历，按列遍历

dataframe之使用iloc切片

dataframe 中缺失值的处理

dataframe的一些用法的更多相关文章

随机推荐

热门专题