迭代器的介绍

迭代器的定义:

迭代器(Iterator)是 Python 中用于遍历数据集合的核心机制。它提供了一种统一的方式来访问容器(如列表、字典、文件等)中的元素,而无需关心底层数据结构的具体实现。迭代器的核心特点是按需生成数据,避免一次性加载所有数据到内存。

迭代器适合处理大型数据、无限序列或需要惰性计算的场景。


迭代器的核心概念:

  1. 迭代器协议

    • 一个对象要成为迭代器,必须实现以下两个方法:

      • __iter__():返回迭代器对象本身(通常直接 return self)。
      • __next__():返回下一个元素,若没有更多元素则抛出 StopIteration 异常。
    • Python 的 for 循环、next() 函数等底层都依赖这一协议。
  2. 可迭代对象(Iterable) VS 迭代器(Iterator)

    • 可迭代对象:实现了 __iter__() 方法,可以返回一个迭代器的对象(如列表、元组、字典)。
    • 迭代器:实现了 __iter__()__next__() 方法的对象。
    • 所有迭代器都是可迭代对象,但可迭代对象本身不一定是迭代器。

    差异体现在遍历机制:

    • 可迭代对象

      每次调用 iter() 会生成新的迭代器,因此可被多次遍历:

      my_list = [1, 2, 3]
      for x in my_list: print(x) # 输出 1,2,3
      for x in my_list: print(x) # 再次输出 1,2,3
    • 迭代器

      遍历是一次性的,遍历完成后无法重置:

      iterator = iter(my_list)
      for x in iterator: print(x) # 输出 1,2,3
      for x in iterator: print(x) # 无输出(迭代器已耗尽)

自定义迭代器

示例 1: 通过类实现迭代器

class CountUpTo:
def __init__(self, max_num):
self.max_num = max_num
self.current = 0 def __iter__(self):
return self # 返回迭代器本身 def __next__(self):
if self.current < self.max_num:
self.current += 1
return self.current
else:
raise StopIteration # 终止迭代 # 使用自定义迭代器
counter = CountUpTo(3)
for num in counter:
print(num) # 输出 1, 2, 3

示例 2: 通过生成器函数实现(简化版)

生成器函数(使用 yield)是创建迭代器的快捷方式:

def count_up_to(max_num):
current = 0
while current < max_num:
current += 1
yield current # 生成器返回的也是迭代器
for num in count_up_to(3):
print(num) # 输出 1, 2, 3

省略的迭代器

写过for循环的都知道,我没用迭代器呀!

用了!只不过是编译器帮你用了。

以下两段代码完全等价:

# 直接遍历列表
my_list = [1, 2, 3, 4, 5]
for x in my_list:
print(x)
# 等价的手动迭代器操作
iterator = iter(my_list) # 自动调用 __iter__() 获取迭代器
while True:
try:
x = next(iterator) # 自动调用 __next__()
print(x)
except StopIteration:
break # 自动处理终止

为什么不需要显式写迭代器?

  • 语法糖(Syntactic Sugar):for 循环是 Python 提供的一种简化语法,隐藏了迭代器的创建和异常处理细节。

  • 统一接口:所有可迭代对象(如列表、元组、字典、集合、字符串等)都可以通过 for 循环统一处理,无需关心底层是列表还是其他数据结构。

生产器的介绍

yield是个英文动词,也是名词,含义是生产的意思。

yield 在 Python里就是生成器。

yield的定义:

Python 的 yield 关键字用于定义生成器函数(Generator Function),生成器是一种特殊的迭代器,能够按需生成值并暂停/恢复执行状态。它的核心特性是惰性求值(Lazy Evaluation),适用于处理大数据流、无限序列或需要节省内存的场景。

核心概念:

  1. 生成器函数

    • 使用 yield 代替 return 的函数。
    • 调用生成器函数时,返回一个生成器对象(迭代器),而非直接执行函数体。
    • 生成器通过 next()for 循环逐步执行,每次遇到 yield 时暂停,返回 yield 后的值,并在下次调用时从暂停处继续执行。
  2. 与普通函数的区别

    • 普通函数一次执行完毕,返回一个结果。
    • 生成器函数逐步产生多个值,并在 yield 处保持状态。

return 的区别:

特性 yield return
返回值数量 可多次返回值 仅返回一次
函数状态 暂停并保留状态 终止函数执行
返回类型 生成器对象(迭代器) 直接返回值
内存占用 低(按需生成) 高(一次性生成所有数据)

yield的普通用法

示例 1: 简单生成器

def simple_generator():
yield 1
yield 2
yield 3 gen = simple_generator()
print(next(gen)) # 输出 1
print(next(gen)) # 输出 2
print(next(gen)) # 输出 3
# 继续调用 next(gen) 会抛出 StopIteration 异常

示例 2:for 循环遍历生成器

def count_up_to(n):
i = 0
while i < n:
yield i
i += 1 for num in count_up_to(5):
print(num) # 输出 0, 1, 2, 3, 4

yield的高级用法

  1. 通过 send() 传递值

    生成器可以通过 send(value) 接收外部传入的值,赋值给 yield 表达式:

    def generator_with_send():
    value = yield "Ready to receive"
    yield f"Received: {value}" gen = generator_with_send()
    print(next(gen)) # 输出 "Ready to receive"
    print(gen.send("Hello")) # 输出 "Received: Hello"
  2. yield from 委托生成

    Python 3.3+ 引入 yield from,用于简化嵌套生成器的操作:

    def sub_generator():
    yield "A"
    yield "B" def main_generator():
    yield from sub_generator()
    yield "C" for item in main_generator():
    print(item) # 输出 A, B, C
  3. 异常处理

    生成器可以通过 throw() 方法接收异常:

    def generator_with_exception(value):
    try:
    yield 10 / value
    except ZeroDivisionError as e:
    yield "Caught ValueError" gen = generator_with_exception(2)
    print(next(gen)) gen = generator_with_exception(0)
    print(next(gen))

    out:

    5.0
    Caught ValueError

yidle的实际应用案例

  1. 大数据处理

    def read_large_file(file_path):
    with open(file_path, "r") as file:
    for line in file:
    yield line.strip() # 逐行生成,避免一次性加载到内存 for line in read_large_file("data.txt"):
    process(line)
  2. 生成无限序列

    def fibonacci():
    a, b = 0, 1
    while True:
    yield a
    a, b = b, a + b fib = fibonacci()
    print([next(fib) for _ in range(10)]) # 前10个斐波那契数
  3. 协程(Coroutine)

    def coroutine():
    while True:
    task = yield
    print(f"Processing: {task}") worker = coroutine()
    next(worker) # 启动协程
    worker.send("Task1") # 输出 "Processing: Task1"
    worker.send("Task2") # 输出 "Processing: Task2"

    在 Python 中,协程(Coroutine) 是一种可以暂停和恢复执行的函数,它能与调用方进行双向通信(接收和发送数据),常用于实现协作式多任务(非抢占式任务切换)。

    上文提供的代码是一个典型的基于生成器的协程(Generator-based Coroutine)。

总结

yield 是 Python 中实现惰性计算协程的核心工具,结合 send()throw()close() 等方法,能够构建高效、灵活的数据流和控制流模型。

Python 迭代器和生成器概念的更多相关文章

  1. Python 迭代器和生成器(转)

    Python 迭代器和生成器 在Python中,很多对象都是可以通过for语句来直接遍历的,例如list.string.dict等等,这些对象都可以被称为可迭代对象.至于说哪些对象是可以被迭代访问的, ...

  2. 一文搞懂Python迭代器和生成器

    很多童鞋搞不懂python迭代器和生成器到底是什么?它们之间又有什么样的关系? 这篇文章就是要用最简单的方式让你理解Python迭代器和生成器! 1.迭代器和迭代过程 维基百科解释道: 在Python ...

  3. Python - 迭代器与生成器 - 第十三天

    Python 迭代器与生成器 迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式. 迭代器是一个可以记住遍历的位置的对象. 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问 ...

  4. 怎么理解Python迭代器与生成器?

    怎么理解Python迭代器与生成器?在Python中,使用for ... in ... 可以对list.tuple.set和dict数据类型进行迭代,可以把所有数据都过滤出来.如下:         ...

  5. Python迭代器,生成器--精华中的精华

    1. 迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...

  6. python迭代器与生成器详解

    迭代器与生成器 迭代器(iterator)与生成器(generator)是 Python 中比较常用又很容易混淆的两个概念,今天就把它们梳理一遍,并举一些常用的例子. for 语句与可迭代对象(ite ...

  7. python迭代器,生成器

    1. 迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...

  8. Python迭代器和生成器你学会了吗?

    在了解什么是迭代器和生成器之前,我们先来了解一下容器的概念.对于一切皆对象来说,容器就是对象的集合.例如列表.元祖.字典等等都是容器.对于容器,你可以很直观地想象成多个元素在一起的单元:而不同容器的区 ...

  9. Python—迭代器与生成器

    迭代器与生成器 生成器(generator) 先来了解一下列表生成器: list = [i*2 for i in range(10)] print(list)>>>>[0, 2 ...

  10. python -迭代器与生成器 以及 iterable(可迭代对象)、yield语句

    我刚开始学习编程没多久,对于很多知识还完全不知道,而有些知道的也是一知半解,我想把学习到的知识记录下来,一是弥补记忆力差的毛病,二也是为了待以后知识能进一步理解透彻时再回来做一个补充. 参考链接: 完 ...

随机推荐

  1. w3cschool-Hadoop 教程

    https://www.w3cschool.cn/hadoop/ 铺垫 人产生数据的速度越来越快,机器则更加快,数据的增长速度通常比算法更快,所以需要另外的一种处理数据的方法. 硬盘的容量增加了,但性 ...

  2. G1原理—9.如何优化G1中的MGC

    大纲 1.大对象导致频繁Mixed GC的案例 2.Mixed GC到底是在优化什么(从避免到提速) 3.Mixed GC相关参数详解之堆内存分配参数 4.Mixed GC其他相关的参数详解及优化 1 ...

  3. BUUCTF刷题-Web方向1~5wp

    [极客大挑战 2019]EasySQL 一个sql注入登录框,直接万能密码登录 拿到flag [极客大挑战 2019]Havefun 打开环境,没有任何信息,查看源码,发现这么一段代码 GET方式传入 ...

  4. 云内GSLB技术及应用场景

    本文分享自天翼云开发者社区<云内GSLB技术及应用场景>,作者:c****n 云业务容灾建设节奏一般是同城双活-异地双活-两地三中心(同城双活+异地多活),因为要解决的问题的复杂度和难度也 ...

  5. 流程控制之if选择结构

    if单选择结构  if (布尔表达式){     //如果布尔表达式为ture将执行的语句 } 实例:  package com.yeyue.struct; ​ import java.util.Sc ...

  6. TOGAF 内容元模型综合指南

    介绍 开放群组架构框架 (TOGAF) 是一种广泛使用的企业架构框架,它提供了一种结构化的方法来设计.规划.实施和管理企业信息技术架构.TOGAF 内容元模型是该框架的重要组成部分,它提供了一种标准化 ...

  7. Typecho 数据备份及程序升级详细步骤教程

    数据库备份看自己,习惯性更新前都备份,出错直接滚回去 数据库备份 直接在宝塔数据库那个模块备份即可,备份完建议下载本地或者保存到OSS 备份网站文件 理论上只需要备份/usr/目录即可,因为这个目录包 ...

  8. centos 运行springboot 项目

    jar文件发布: 准备工作: 发布在springboot项目中的pom.xml文件添加如下: <build> <plugins> <plugin> <grou ...

  9. php stripslashes 函数的意思

    脑子不行了,很多东西看过就忘,比如这个stripslashes,知道是去除反斜杠,但为啥用它死活想不起来,搜索一下,把这几篇文章抄下来: 1.反斜杠是怎么回事 两个东西 ini_set(magic_q ...

  10. opencv实现像素统计的示例代码

    在 OpenCV 中,统计图像的像素信息(如像素值分布.最大值.最小值.均值等)是常见的操作.以下是一些常用的方法和函数,用于统计图像的像素信息: 统计像素值的基本信息 最大值.最小值.均值.标准差: ...