pandas中Dataframe的一些用法

pandas读取excel文件

pd.read_excel 前提是安装xlrd库

dataframe，numpy，list之间的互相转换

dataframe转numpy ：dataframe对象.values
dataframe转list：dataframe对象.values.tolist()
list转numpy：np.array(list对象)
list转dataframe：pd.DataFrame(list对象)
numpy转list：numpy对象.tolist()
numpy转dataframe:pd.DataFrame(numpy对象)

dataframe 按行遍历，按列遍历

按行遍历:

常用df.iterrows()

import pandas as pd

demo_list = [[1,2],

             [3,4]]

#用list构建dataframe

demo_df = pd.DataFrame(demo_list)

print(demo_df)

#接上

for row in demo_df.iterrows():

	print(type(row))

    print(row[0])

    print(row[1])

可以看到每个row的类型是tuple元组类型，元组长度为2，元组第0个元素为index，第1个元素为横向的series。**值得注意的是，在遍历过程中如果取每一行的某个值，通过对row[1]进行切片即可。 **

按列遍历

经常使用df.columns获取列名然后访问

#接上

print(demo_df.columns)

for column in demo_df.columns:

    print(demo_df[column])

dataframe之使用iloc切片

先构建dataframe

import numpy as np

import pandas as pd

##list构建5x5的dataframe，由于dataframe没有reshape，因此需要借助numpy

demo_list = [i for i in range(25)]

demo_np = np.array(demo_list).reshape(5,5)

demo_df = pd.DataFrame(demo_list)

print(demo_df)

iloc[start:end ,start :end ]表示按行列取出dataframe的值。其中逗号前面表示行，逗号后面表示列。冒号左侧表示开始，冒号右侧表示结束(遵循左闭右开原则)。例如，demo_df.iloc[2:4,1:3]表示切片第二行到第三行第一列到第二列数据。切片返回的数据类型还是dataframe。

iloc[start: end :step,start:end :step]是在上一个切片的基础上加上了步长。表示从start到end每step步取一次值。

dataframe 中缺失值的处理

均值填充

通常使用fillna()

##获取存在缺失值的列名列表

null_columns=list(file_df.columns[file_df.isnull().sum() > 0])

for column in null_columns :

    #计算每一列的均值

	mean_val = file_df[column].mean()

	#使用fillna进行均值填充

    file_df[column].fillna(mean_val, inplace=True)

dataframe的一些用法的更多相关文章

DataFrame的apply用法
DataFrame的apply方法: def cal_value_percent(row,total_value): row['new_column']=row[estimated_value_col ...
python对dataframe的相关用法
1.选择列名包含特殊字符的列 d2 = d1.loc[:, d1.columns.str.contains('vib')] 2.选择列名开头为包含特殊字符的列 df2 = df1.loc[:, df1 ...
Pandas 基础(2) - Dataframe 基础
上一节我们已经对 Dataframe 的概念做了一个简单的介绍, 这一节将具体看下它的一些基本用法: 首先, 准备一个 excel 文件, 大致内容如下, 并保存成 .csv 格式. 然后, 在 ju ...
spark学习（1）---dataframe操作大全
一.dataframe操作大全 https://blog.csdn.net/dabokele/article/details/52802150 https://www.jianshu.com/p/00 ...
Spark实战电影点评系统(二)
二.通过DataFrame实战电影点评系统 DataFrameAPI是从Spark 1.3开始就有的,它是一种以RDD为基础的分布式无类型数据集,它的出现大幅度降低了普通Spark用户的学习门槛. D ...
spark自定义函数之——UDF使用详解及代码示例
前言本文介绍如何在Spark Sql和DataFrame中使用UDF,如何利用UDF给一个表或者一个DataFrame根据需求添加几列,并给出了旧版(Spark1.x)和新版(Spark2.x)完整 ...
PySpark 大数据处理
本文主要介绍Spark的一些基本算子,PySpark及Spark SQL 的使用方法. 虽然我从2014年就开始接触Spark,但几年来一直没有真正地学以致用,时间一久便忘了如何使用,直到在工作中用到 ...
pandas-03 DataFrame()中的iloc和loc用法
pandas-03 DataFrame()中的iloc和loc用法简单的说: iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[10:20, 3:5 ...
转化dataframe中一组序列为时间序列的方法-to_datetime()的最新用法
一.to_datetime()的最新用法: hs300_hf['date'] = pd.to_datetime(hs300_hf['date']) hs300_hf.set_index('date', ...

随机推荐

burp插件之跨站payload批量注入-xssValidator
环境搭建 Phantomjs下载 csdn-burp使用xssValidator插件 cnblog-burp插件之xssValidator xssValidator使用参考链接 cnblog-bur ...
[原题复现+审计][0CTF 2016] WEB piapiapia(反序列化、数组绕过)[改变序列化长度，导致反序列化漏洞]
简介原题复现: 考察知识点:反序列化.数组绕过线上平台:https://buuoj.cn(北京联合大学公开的CTF平台) 榆林学院内可使用信安协会内部的CTF训练平台找到此题漏洞学习数组 ...
SQL注入学习-Dnslog盲注
1.基础知识 1.DNS DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的 ...
面试官：小伙子，你给我说一下Java Exception 和 Error 的区别吧？
前言昨天在整理粉丝给我私信的时候,发现了一个挺有意思的事情.是这样的,有一个粉丝朋友私信问我Java 的 Exception 和 Error 有什么区别呢?说他在面试的时候被问到这个问题卡壳了,最后 ...
ABBYY FineReader 15新增智能PDF文档转换功能
ABBYY FineReader 15(Windows系统)新增智能PDF文档转换功能,可自动检测导入PDF数字文档的文本层质量,确保转变为可编辑格式后的准确结果:从表单字段和文本框中提取文本,准确保 ...
使用Camtasia来消除视频中的声音
大多数情况下,我们在录制电脑屏幕的时候都会把音频输出也一起录制下来,但也会有时候要后期进行重新配音,需要把事先一同录制的音频消除掉,今天小编来给大家说一说如何消除这种的视频声音. 首先打开Camtas ...
{"non_field_errors":["Unable to log in with provided credentials."]}% 无法使用提供的凭据登录
在使用rest_framework_jwt进行登陆验证获取token的时候会报 {"non_field_errors":["Unable to log in with p ...
python批量爬取猫咪图片
不多说直接上代码首先需要安装需要的库,安装命令如下 pip install BeautifulSoup pip install requests pip install urllib pip ins ...
G - Pyramid 题解(打表）
题目链接题目大意 t组数据,给你一个n(n<=1e9)求高度为n的等边三角形,求里面包含了多少个等边三角形题目思路打表找规律,然而我一直没找到规律. 看到题解恍然大悟,答案就是C(n+3, ...
CentOS6.5上增加中文字体库，确保前端WEB可以正常显示
1 下载字体可以在网上下载,也可以在 windows 目录下(C:\Windows\Fonts)找到对应字体,这里是从另一套系统上 copy simsun.ttf 文件. 2 查看当前系统中已安装的 ...

dataframe的一些用法

pandas中Dataframe的一些用法

pandas读取excel文件

dataframe，numpy，list之间的互相转换

dataframe 按行遍历，按列遍历

dataframe之使用iloc切片

dataframe 中缺失值的处理

dataframe的一些用法的更多相关文章

随机推荐

热门专题