Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时,它被视为数组式,基本迭代产生这些值。其他数据结构,如:DataFramePanel,遵循类似惯例,迭代对象的键。

简而言之,基本迭代(对于i在对象中)产生 -

  • Series - 值
  • DataFrame - 列标签
  • Pannel - 项目标签

迭代DataFrame

  迭代DataFrame默认迭代对象的键(列)。

import pandas as pd
import numpy as np N=20 df = pd.DataFrame({
'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
'x': np.linspace(0,stop=N-1,num=N),
'y': np.random.rand(N),
'C': np.random.choice(['Low','Medium','High'],N).tolist(),
'D': np.random.normal(100, 10, size=(N)).tolist()
}) print(df)
print('\n') for col in df:
print (col)

输出结果:

            A     x         y       C           D
0 2016-01-01 0.0 0.433094 Medium 122.454137
1 2016-01-02 1.0 0.702406 Low 87.920907
2 2016-01-03 2.0 0.106648 Low 110.453026
3 2016-01-04 3.0 0.553946 High 93.357313
4 2016-01-05 4.0 0.055309 Medium 101.677134
5 2016-01-06 5.0 0.870506 Low 93.611441
6 2016-01-07 6.0 0.265124 High 89.684828
7 2016-01-08 7.0 0.608606 Medium 106.256583
8 2016-01-09 8.0 0.915061 High 87.611971
9 2016-01-10 9.0 0.403021 Medium 118.759460
10 2016-01-11 10.0 0.042113 Medium 96.181790
11 2016-01-12 11.0 0.740301 Low 105.394580
12 2016-01-13 12.0 0.996189 Low 101.069863
13 2016-01-14 13.0 0.204401 Medium 107.772976
14 2016-01-15 14.0 0.595775 High 93.862074
15 2016-01-16 15.0 0.449922 Medium 95.686896
16 2016-01-17 16.0 0.649613 Low 95.902673
17 2016-01-18 17.0 0.549016 Medium 103.786598
18 2016-01-19 18.0 0.428497 Medium 82.460432
19 2016-01-20 19.0 0.426844 High 107.196597 A
x
y
C
D

要遍历数据帧(DataFrame)中的,可以使用以下函数:

  • iteritems() - 迭代(key,value)
  • iterrows() - 将行迭代为(索引,系列)对
  • itertuples() - 以namedtuples的形式迭代行

iteritems()

  将每个列作为键,将值与值作为键和列值,迭代为Series对象。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3']) print(df)
print('\n') for key,value in df.iteritems():
print (key,value,'\n')

输出结果:

       col1      col2      col3
0 0.096004 1.836687 0.513612
1 0.506905 -0.042988 -0.438362
2 -1.425654 1.081005 0.182610
3 -0.746107 -0.971394 -0.204752 col1 0 0.096004
1 0.506905
2 -1.425654
3 -0.746107
Name: col1, dtype: float64 col2 0 1.836687
1 -0.042988
2 1.081005
3 -0.971394
Name: col2, dtype: float64 col3 0 0.513612
1 -0.438362
2 0.182610
3 -0.204752
Name: col3, dtype: float64

观察一下,单独迭代每个列作为系列中的键值对。

iterrows()

  iterrows()返回迭代器,产生每个索引值以及包含每行数据的序列。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
print (row_index,row,'\n')

输出结果:

  col1    1.529759
col2 0.762811
col3 -0.634691
Name: 0, dtype: float64 col1 -0.944087
col2 1.420919
col3 -0.507895
Name: 1, dtype: float64 col1 -0.077287
col2 -0.858556
col3 -0.663385
Name: 2, dtype: float64
col1 -1.638578
col2 0.059866
col3 0.493482
Name: 3, dtype: float64
 

注意 - 由于iterrows()遍历行,因此不会跨该行保留数据类型。0,1,2是行索引,col1col2col3是列索引。

itertuples()

itertuples()方法将为DataFrame中的每一行返回一个产生一个命名元组的迭代器元组的第一个元素将是行的相应索引值,而剩余的值是行值。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
print (row)

输出结果:

Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-0.6346908238310438)
Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-0.50789517967096232)
Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-0.6633852507207626)
Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,col3=0.80344487462316527)

Pandas | 09 迭代的更多相关文章

  1. pandas:数据迭代、函数应用

    1.数据迭代 1.1 迭代行 (1)df.iterrows() for index, row in df[0:5].iterrows(): #需要两个变量承接数据 print(row) print(& ...

  2. pandas优化

    目录 前言 使用Datetime数据节省时间 pandas数据的循环操作 使用itertuples() 和iterrows() 循环 Pandas的 .apply()方法 矢量化操作:使用.isin( ...

  3. Windows7WithSP1/TeamFoundationServer2012update4/SQLServer2012

    [Info   @09:03:33.737] ====================================================================[Info   @ ...

  4. ML第5周学习小结

    本周收获 总结一下本周学习内容: 1.学习了<深入浅出Pandas>的第五章:Pandas高级操作的两个内容 数据迭代 函数应用 我的博客链接: pandas:数据迭代.函数应用 2.&l ...

  5. 如何迭代pandas dataframe的行

    from:https://blog.csdn.net/tanzuozhev/article/details/76713387 How to iterate over rows in a DataFra ...

  6. Pandas迭代

    Pandas对象之间的基本迭代的行为取决于类型.当迭代一个系列时,它被视为数组式,基本迭代产生这些值.其他数据结构,如:DataFrame和Panel,遵循类似惯例迭代对象的键. 简而言之,基本迭代( ...

  7. pandas 读取excle ,迭代

    # -*-coding:utf-8 -*- import pandas as pd xls_file=pd.ExcelFile('D:\python_pro\\address_list.xlsx') ...

  8. 3.09课·········for穷举和迭代

    for循环拥有两类:穷举和迭代穷举:把所有可能的情况都走一遍,使用if条件筛选出来满足条件的情况. 1.单位给发了一张150元购物卡,拿着到超市买三类洗化用品.洗发水15元,香皂2元,牙刷5元.求刚好 ...

  9. numpy&pandas基础

    numpy基础 import numpy as np 定义array In [156]: np.ones(3) Out[156]: array([1., 1., 1.]) In [157]: np.o ...

随机推荐

  1. .NET Core:路由

    (1)模板路由 在Startup的Configure方法中配置: app.UseMvc(routes =>{ routes.MapRoute( name: "areas", ...

  2. PyQt5笔记之菜单栏

    目录 菜单栏 创建单层菜单 创建多层菜单 右键打开菜单 官方菜单实例 菜单常用方法 菜单栏 创建单层菜单 import sys from PyQt5.QtWidgets import QApplica ...

  3. Linux 分区管理器

    下面的列表没有特定的排名顺序.大多数分区工具应该存在于 Linux 发行版的仓库中. GParted 这可能是 Linux 发行版中最流行的基于 GUI 的分区管理器.你可能已在某些发行版中预装它.如 ...

  4. sql server锁表、查询被锁表、解锁被锁表的相关语句

    MSSQL(SQL Server)在我的印象中很容易锁表,大致原因就是你在一个窗口中执行的DML语句没有提交,然后又打开了一个窗口对相同的表进行CRUD操作,这样就会导致锁表.锁表是一种保持数据一致性 ...

  5. Prometheus 安装Alertmanager集成

    Prometheus 安装Alertmanager集成 # 下载地址 地址1:https://prometheus.io/download/ 地址2:https://github.com/promet ...

  6. POSIX 正则表达式 BRE与ERE的差异

    BRE,标准正则表达式,basic regular expressions ERE,扩展正则表达式,Extended Regular Expressions POSIX 正则表达式 传统上,POSIX ...

  7. 排序算法Java代码实现(六)—— 堆排序

    本片内容: 堆排序 堆排序 最大堆: 二叉堆是完全二叉树或者是近似完全二叉树, 当父结点的键值总是大于或等于任何一个子节点的键值时为最大堆.(父节点大于任何一个子节点) 算法思想: 把n个元素建立最大 ...

  8. mysql 查询数据库表信息,字段信息

    #======================================================================= #查询表信息 select table_name, t ...

  9. js计算两经纬度之间的距离

    js如下: // 方法定义 lat,lng function GetDistance( lat1, lng1, lat2, lng2){    var radLat1 = lat1*Math.PI / ...

  10. 安装oracle时出现的问题

    数据库引擎和几个功能安装失败后  ,重新再装还是一样,好不容易全部功能装完成后结果发现登录不了oracle!!!!!!!!!!!!! 气死人,搞了一上午才发现原来是微软账号在搞事,登录本地管理员账户就 ...