pandas中的遍历方式速度对比

对一个20667行的xlsx文件进行遍历测试



import pandas as pd

# 定义一个计算执行时间的函数作装饰器，传入参数为装饰的函数或方法

def print_execute_time(func):

    from time import time

    # 定义嵌套函数，用来打印出装饰的函数的执行时间

    def wrapper(*args, **kwargs):

        # 定义开始时间和结束时间，将func夹在中间执行，取得其返回值

        start = time()

        func_return = func(*args, **kwargs)

        end = time()

        # 打印方法名称和其执行时间

        print(f'{func.__name__}() execute time: {end - start}s')

        # 返回func的返回值

        return func_return

    # 返回嵌套的函数

    return wrapper

file_path = r"D:\git\xxxx\dev\pd-xxx1.2\合并.xlsx"

data = pd.read_excel(file_path,sheet_name="xxxx",engine='openpyxl')

# 空值处理

df = data.where(data.notnull(),None)

@print_execute_time

def iterrows():

    for index, row in df.iterrows():

        # print(index," = ",row['机号'])

        pass

@print_execute_time

def itertuples():

    for row in df.itertuples():

        # print(row['机号'])

        pass

@print_execute_time

def iteritems():

    for index, row in df.iteritems():

        # print(index," = ",row['机号'])

        pass

@print_execute_time

def index():

    for i in df.index:

        # print(i," = ",df['机号'].at[i])

        pass

if __name__ == '__main__':

    print('begining ...')

    print(iterrows(),itertuples(),iteritems(),index())

    print('Done !')

测试结果

begining ...

iterrows() execute time: 2.003657817840576s

itertuples() execute time: 0.04618692398071289s

iteritems() execute time: 0.0009987354278564453s

index() execute time: 0.0029909610748291016s

Done !

iterrows() execute time: 2.2464449405670166s

itertuples() execute time: 0.08178043365478516s

iteritems() execute time: 0.000997781753540039s

index() execute time: 0.0059833526611328125s

因此从效率上考虑,优先采用iteritems或index来进行遍历数据

pandas中的遍历方式速度对比的更多相关文章

Pandas 中的遍历与并行处理
使用 pandas 处理数据时,遍历和并行处理是比较常见的操作了本文总结了几种不同样式的操作和并行处理方法. 1. 准备示例数据 import pandas as pd import numpy as ...
Java(8)中List的遍历方式总结
本篇文章主要讲述了List这一集合类型在Java,包括Java8中的遍历方式,不包括其他的过滤,筛选等操作,这些操作将会在以后的文章中得到提现,由List可以类推到Set等类似集合的遍历方式. pub ...
程序猿必知会的JavaScript 的遍历方式
不管是移动移动端开发还是web端开发,我们对JS的使用频率都在增加,今天小编将要和大家分享的就是JavaScript中,遍历方式的一些实现方法,个人感觉还是很有用的,有兴趣的童鞋可以一起来看看. 为了 ...
[线索二叉树] [LeetCode] 不需要栈或者别的辅助空间，完成二叉树的中序遍历。题：Recover Binary Search Tree，Binary Tree Inorder Traversal
既上篇关于二叉搜索树的文章后,这篇文章介绍一种针对二叉树的新的中序遍历方式,它的特点是不需要递归或者使用栈,而是纯粹使用循环的方式,完成中序遍历. 线索二叉树介绍首先我们引入“线索二叉树”的概念: ...
iOS开发中数组常用的五种遍历方式
随着iOS的不断发展,apple也不断推出性能更高的数组遍历方式,下面将对熟悉的五种遍历方式进行列举. 首先定义一个数组,并获取数组长度 NSArray *array=@[",]; NSIn ...
lua中for循环的四种遍历方式
lua中for的四种遍历方式区别 table.maxn 取最大的整数key #table 从1开始的顺序整数最大值,如1,2,3,6 #table == 3 key,value pairs 取每一 ...
Java中HashMap遍历的两种方式
Java中HashMap遍历的两种方式转]Java中HashMap遍历的两种方式原文地址: http://www.javaweb.cc/language/java/032291.shtml 第一种: ...
C++编程练习(8)----“二叉树的建立以及二叉树的三种遍历方式“（前序遍历、中序遍历、后续遍历）
树利用顺序存储和链式存储的特点,可以实现树的存储结构的表示,具体表示法有很多种. 1)双亲表示法:在每个结点中,附设一个指示器指示其双亲结点在数组中的位置. 2)孩子表示法:把每个结点的孩子排列起来 ...
Java中List集合的三种遍历方式(全网最详)
List集合在Java日常开发中是必不可少的,只要懂得运用各种各样的方法就可以大大提高我们开发的效率,适当活用各种方法才会使我们开发事半功倍. 我总结了三种List集合的遍历方式,下面一一来介绍. 首 ...

随机推荐

[论文阅读笔记] node2vec Scalable Feature Learning for Networks
[论文阅读笔记] node2vec:Scalable Feature Learning for Networks 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问题由于DeepWal ...
CentOS8_在线安装_网络源_网络镜像源填写格式_以及其他笔记
CentOS8_在线安装_网络源_网络镜像源填写格式_以及其他笔记转载注明来源: 本文链接来自osnosn的博客,写于 2020-10-1. 参考: Centos8.0.1905 在线安装源选择 ...
吃透论文——推荐算法不可不看的DeepFM模型
大家好,我们今天继续来剖析一些推荐广告领域的论文. 今天选择的这篇叫做DeepFM: A Factorization-Machine based Neural Network for CTR Pred ...
当音乐学博士搞起编程，用一本书改变了Java世界！
前言说到Spring,也许现在的开发者们最先想到的是 Josh Long 超快的语速与现场代码能力,让很多Java开发者折服. 然后Spring的历史上,最传奇的还是要数其创始人:Rod Johns ...
uni-app阻止事件向父级冒泡
在官网找到的就只有这个方法,但是我放在app项目里并不支持,所以就想到vue的阻止事件冒泡的方法,现在分享,免得大家踩坑 <view class="parent" @ ...
【JavaWeb】JSTL 标签库
JSTL 标签库简介 JSTL(JSP Standard Tag Library),即 JSP 标准标签库.标签库是为了替换代码脚本,使得整个 jsp 页面变得更加简洁. JSTL 有五个功能不同的 ...
LeetCode344 反转字符串
编写一个函数,其作用是将输入的字符串反转过来. 示例 1: 输入: "hello" 输出: "olleh" 示例 2: 输入: "A man, a p ...
alter column和modify column
5.6中,发现其实alter column 和更改modify column 步骤是一样的 mysql> create table xs(name varchar(12),age int def ...
leetcode 93. Restore IP Addresses（DFS，模拟）
题目链接 leetcode 93. Restore IP Addresses 题意给定一段序列,判断可能组成ip数的所有可能集合思路可以采用模拟或者DFS的想法,把总的ip数分成四段,每段判断是 ...
STM32延时函数的四种方法
单片机编程过程中经常用到延时函数,最常用的莫过于微秒级延时delay_us()和毫秒级delay_ms().本文基于STM32F207介绍4种不同方式实现的延时函数. 1.普通延时这种延时方式应该是 ...

pandas中的遍历方式速度对比

测试结果

pandas中的遍历方式速度对比的更多相关文章

随机推荐

热门专题