pandas df 遍历行方法

pandas 遍历有以下三种访法。

iterrows（）：在单独的变量中返回索引和行项目，但显着较慢
itertuples（）：快于.iterrows（），但将索引与行项目一起返回，ir [0]是索引
zip：最快，但不能访问该行的索引

df= pd.DataFrame({'a': range(0, 10000), 'b': range(10000, 20000)})

0.for i in df:并不是遍历行的方式

for i in df:

    print(i)

正式因为for in df不是直接遍历行的方式所以我们研究了如下方法。

1.iterrows（）：在单独的变量中返回索引和行项目，但显着较慢

df.iterrows()其实返回也是一个tuple=>(索引，Series)

count=0

for i,r in df.iterrows():

    print(i,'-->',r,type(r))

    count+=1

    if count>5:

        break

2.itertuples（）：快于.iterrows（），但将索引与行项目一起返回，ir [0]是索引

count=0

for tup in df.itertuples():

    print(tup[0],'-->',tup[1::],type(tup[1:]))

    count+=1

    if count>5:

        break

3.zip：最快，但不能访问该行的索引

count=0

for tup in zip(df['a'], df['b']):

    print(tup,type(tup[1:]))

    count+=1

    if count>5:

        break

4.性能比较

df = pd.DataFrame({'a': range(0, 10000), 'b': range(10000, 20000)})

import time

list1 = []

start = time.time()

for i,r in df.iterrows():

    list1.append((r['a'], r['b']))

print("iterrows耗时  :",time.time()-start)

list1 = []

start = time.time()

for ir in df.itertuples():

    list1.append((ir[1], ir[2]))

print("itertuples耗时:",time.time()-start)

list1 = []

start = time.time()

for r in zip(df['a'], df['b']):

    list1.append((r[0], r[1]))

print("zip耗时       :",time.time()-start)

pandas df 遍历行方法的更多相关文章

Pandas 常见的基本方法
说明:文章所有内容均截选自实验楼教程[Pandas 使用教程],想要查看教程完整内容,点击教程即可~ 前言: Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取.转换.过滤 ...
pandas DataFrame的创建方法
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas-15 df['one_col'].apply()方法的用法
pandas-15 df['one_col'].apply()方法的用法 apply有点像map的用法,可以传入一个函数. 如:df['A'].apply(str.upper) import nump ...
简单又强大的pandas爬虫利用pandas库的read_html()方法爬取网页表格型数据
文章目录一.简介二.原理三.爬取实战实例1 实例2 一.简介一般的爬虫套路无非是发送请求.获取响应.解析网页.提取数据.保存数据等步骤.构造请求主要用到requests库,定位提取数据用的比 ...
pandas DataFrame的修改方法
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas DataFrame的查询方法（loc,iloc,at,iat,ix的用法和区别）
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas.DataFrame的groupby()方法的基本使用
pandas.DataFrame的groupby()方法是一个特别常用和有用的方法.让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝. 首先导入package: import p ...
jQuery 遍历 - parent() 方法
ylbtech-jQuery-sizzle:jQuery 遍历 - parent() 方法 parent() 获得当前匹配元素集合中每个元素的父元素,使用选择器进行筛选是可选的. 1.A,jQuer ...
java集合类遍历删除方法测试以及使用场景记录
package test0; import java.util.List; import java.util.Map; import java.util.Map.Entry; import java. ...

随机推荐

【贪心科技】贪心科技内容合伙人关于AI公司及创业的演讲笔记
贪心科技内容合伙人关于AI公司及创业的演讲笔记视频目录一.投资角度对 AI 的两个基本认知二.简单分析 AI 公司的两个纬度四个层面三.AI 垂直行业应用的三点中美对比四.给创业者的四个建 ...
（十三）mybatis 整合 ehcache
目录 ehcache mybatis 的 Cache 接口整合步骤 ehcache ehcache 是一个分布式缓存框架 ! 为什么需要分布式缓存? 在大型的项目中,服务器是肯定不止一台的,每台服务 ...
使用JavaScript随机生成数字混合字母的验证码
<script> // 封装一个随机生成数字的函数 function random(a, b) { var n = Math.round(Math.random() * (a - b) ...
redis键空间通知(keyspace notification)
一.需求在redis中,设置好key和生存时间之后,希望key过期被删除时能够及时的发送一个通知告诉我key,以便我做后续的一些操作. 二.环境系统:windows10 php:7.1 redis ...
unittest参数化（paramunittest）
前言 paramunittest是unittest实现参数化的一个专门的模块,可以传入多组参数,自动生成多个用例前面讲数据驱动的时候,用ddt可以解决多组数据传入,自动生成多个测试用例.本篇继续介绍另 ...
适合新手的160个creakme（一）
先跑一下直接使用这个字符串去check,发现提示信息有关键字符串 CODE:0042FB80 00000021 C Sorry , The serial is incorect ! 找到这个字符串的 ...
docker服务端与客户端通信方式
docker的服务端与客户端间可以通过unix.tcp方式进行通信.但默认情况下,服务端只监听本地unix接口/var/run/docker.sock,所以客户端只能在服务端所在的机器上使用该unix ...
volatile 关键字（修饰变量）
目录 volatile 关键字(修饰变量) 1. 含义 2. 作用 3. 如何保证可见性 4. 如何禁止指令重排序优化 5. volatile 是不安全的 6. volatile 不适用场景 vola ...
怎样修改一个已存在的Cookie
Cookie的修改也需要借助 Response-Header 的 Set-Cookie 字段, 不过需要注意的是: 待修改cookie的 key / domain / path / secure 必须 ...
NetCore2.x 使用Log4Net(一)
前言:本章仅仅是Log4Net的基本简单的运用,后续章节会按照我的项目使用情况进行深入研究 1.项目搭建新建一个基于.netCore2.x的Web项目 => 过程略给新 ...

pandas df 遍历行方法

0.for i in df:并不是遍历行的方式

1.iterrows（）：在单独的变量中返回索引和行项目，但显着较慢

2.itertuples（）：快于.iterrows（），但将索引与行项目一起返回，ir [0]是索引

3.zip：最快，但不能访问该行的索引

4.性能比较

pandas df 遍历行方法的更多相关文章

随机推荐

热门专题