迭代器的介绍

迭代器的定义：

迭代器（Iterator）是 Python 中用于遍历数据集合的核心机制。它提供了一种统一的方式来访问容器（如列表、字典、文件等）中的元素，而无需关心底层数据结构的具体实现。迭代器的核心特点是按需生成数据，避免一次性加载所有数据到内存。

迭代器适合处理大型数据、无限序列或需要惰性计算的场景。

迭代器的核心概念：

迭代器协议：
- 一个对象要成为迭代器，必须实现以下两个方法：
  - __iter__()：返回迭代器对象本身（通常直接 return self）。
  - __next__()：返回下一个元素，若没有更多元素则抛出 StopIteration 异常。
- Python 的 for 循环、next() 函数等底层都依赖这一协议。
可迭代对象（Iterable） VS 迭代器（Iterator）：
- 可迭代对象：实现了 __iter__() 方法，可以返回一个迭代器的对象（如列表、元组、字典）。
- 迭代器：实现了 __iter__() 和 __next__() 方法的对象。
- 所有迭代器都是可迭代对象，但可迭代对象本身不一定是迭代器。
差异体现在遍历机制：
- 可迭代对象：
  
  每次调用 iter() 会生成新的迭代器，因此可被多次遍历：
```
my_list = [1, 2, 3]

for x in my_list: print(x)  # 输出 1,2,3

for x in my_list: print(x)  # 再次输出 1,2,3
```
- 迭代器：
  
  遍历是一次性的，遍历完成后无法重置：
```
iterator = iter(my_list)

for x in iterator: print(x)  # 输出 1,2,3

for x in iterator: print(x)  # 无输出（迭代器已耗尽）
```

自定义迭代器

示例 1： 通过类实现迭代器

class CountUpTo:

    def __init__(self, max_num):

        self.max_num = max_num

        self.current = 0

    def __iter__(self):

        return self  # 返回迭代器本身

    def __next__(self):

        if self.current < self.max_num:

            self.current += 1

            return self.current

        else:

            raise StopIteration  # 终止迭代

# 使用自定义迭代器

counter = CountUpTo(3)

for num in counter:

    print(num)  # 输出 1, 2, 3

示例 2： 通过生成器函数实现（简化版）

生成器函数（使用 yield）是创建迭代器的快捷方式：

def count_up_to(max_num):

    current = 0

    while current < max_num:

        current += 1

        yield current

# 生成器返回的也是迭代器

for num in count_up_to(3):

    print(num)  # 输出 1, 2, 3

省略的迭代器

写过for循环的都知道，我没用迭代器呀！

用了！只不过是编译器帮你用了。

以下两段代码完全等价：

# 直接遍历列表

my_list = [1, 2, 3, 4, 5]

for x in my_list:

    print(x)

# 等价的手动迭代器操作

iterator = iter(my_list)  # 自动调用 __iter__() 获取迭代器

while True:

    try:

        x = next(iterator)  # 自动调用 __next__()

        print(x)

    except StopIteration:

        break  # 自动处理终止

为什么不需要显式写迭代器？

语法糖（Syntactic Sugar）：for 循环是 Python 提供的一种简化语法，隐藏了迭代器的创建和异常处理细节。
统一接口：所有可迭代对象（如列表、元组、字典、集合、字符串等）都可以通过 for 循环统一处理，无需关心底层是列表还是其他数据结构。

生产器的介绍

yield是个英文动词，也是名词，含义是生产的意思。

yield 在 Python里就是生成器。

yield的定义：

Python 的 yield 关键字用于定义生成器函数（Generator Function），生成器是一种特殊的迭代器，能够按需生成值并暂停/恢复执行状态。它的核心特性是惰性求值（Lazy Evaluation），适用于处理大数据流、无限序列或需要节省内存的场景。

核心概念：

生成器函数：
- 使用 yield 代替 return 的函数。
- 调用生成器函数时，返回一个生成器对象（迭代器），而非直接执行函数体。
- 生成器通过 next() 或 for 循环逐步执行，每次遇到 yield 时暂停，返回 yield 后的值，并在下次调用时从暂停处继续执行。
与普通函数的区别：
- 普通函数一次执行完毕，返回一个结果。
- 生成器函数逐步产生多个值，并在 yield 处保持状态。

与 return 的区别：

特性	`yield`	`return`
返回值数量	可多次返回值	仅返回一次
函数状态	暂停并保留状态	终止函数执行
返回类型	生成器对象（迭代器）	直接返回值
内存占用	低（按需生成）	高（一次性生成所有数据）

yield的普通用法

示例 1： 简单生成器

def simple_generator():

    yield 1

    yield 2

    yield 3

gen = simple_generator()

print(next(gen))  # 输出 1

print(next(gen))  # 输出 2

print(next(gen))  # 输出 3

# 继续调用 next(gen) 会抛出 StopIteration 异常

示例 2： 用 for 循环遍历生成器

def count_up_to(n):

    i = 0

    while i < n:

        yield i

        i += 1

for num in count_up_to(5):

    print(num)  # 输出 0, 1, 2, 3, 4

yield的高级用法

通过 send() 传递值

生成器可以通过 send(value) 接收外部传入的值，赋值给 yield 表达式：

def generator_with_send():

	value = yield "Ready to receive"

	yield f"Received: {value}"

gen = generator_with_send()

print(next(gen))         # 输出 "Ready to receive"

print(gen.send("Hello")) # 输出 "Received: Hello"

yield from 委托生成

Python 3.3+ 引入 yield from，用于简化嵌套生成器的操作：

def sub_generator():

	yield "A"

	yield "B"

def main_generator():

	yield from sub_generator()

	yield "C"

for item in main_generator():

	print(item)  # 输出 A, B, C

异常处理

生成器可以通过 throw() 方法接收异常：

def generator_with_exception(value):

	try:

		yield 10 / value

	except ZeroDivisionError as e:

		yield "Caught ValueError"

gen = generator_with_exception(2)

print(next(gen))

gen = generator_with_exception(0)

print(next(gen))

out:

5.0

Caught ValueError

yidle的实际应用案例

大数据处理：

def read_large_file(file_path):

    with open(file_path, "r") as file:

        for line in file:

            yield line.strip()  # 逐行生成，避免一次性加载到内存

for line in read_large_file("data.txt"):

    process(line)

生成无限序列：

def fibonacci():

    a, b = 0, 1

    while True:

        yield a

        a, b = b, a + b

fib = fibonacci()

print([next(fib) for _ in range(10)])  # 前10个斐波那契数

协程（Coroutine）：
```
def coroutine():

    while True:

        task = yield

        print(f"Processing: {task}")

worker = coroutine()

next(worker)       # 启动协程

worker.send("Task1")  # 输出 "Processing: Task1"

worker.send("Task2")  # 输出 "Processing: Task2"
```
在 Python 中，协程（Coroutine）是一种可以暂停和恢复执行的函数，它能与调用方进行双向通信（接收和发送数据），常用于实现协作式多任务（非抢占式任务切换）。

上文提供的代码是一个典型的基于生成器的协程（Generator-based Coroutine）。

总结

yield 是 Python 中实现惰性计算和协程的核心工具，结合 send()、throw()、close() 等方法，能够构建高效、灵活的数据流和控制流模型。

Python 迭代器和生成器概念的更多相关文章

Python 迭代器和生成器(转)
Python 迭代器和生成器在Python中,很多对象都是可以通过for语句来直接遍历的,例如list.string.dict等等,这些对象都可以被称为可迭代对象.至于说哪些对象是可以被迭代访问的, ...
一文搞懂Python迭代器和生成器
很多童鞋搞不懂python迭代器和生成器到底是什么?它们之间又有什么样的关系? 这篇文章就是要用最简单的方式让你理解Python迭代器和生成器! 1.迭代器和迭代过程维基百科解释道: 在Python ...
Python - 迭代器与生成器 - 第十三天
Python 迭代器与生成器迭代器迭代是Python最强大的功能之一,是访问集合元素的一种方式. 迭代器是一个可以记住遍历的位置的对象. 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问 ...
怎么理解Python迭代器与生成器？
怎么理解Python迭代器与生成器?在Python中,使用for ... in ... 可以对list.tuple.set和dict数据类型进行迭代,可以把所有数据都过滤出来.如下: ...
Python迭代器，生成器--精华中的精华
1. 迭代器迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...
python迭代器与生成器详解
迭代器与生成器迭代器(iterator)与生成器(generator)是 Python 中比较常用又很容易混淆的两个概念,今天就把它们梳理一遍,并举一些常用的例子. for 语句与可迭代对象(ite ...
python迭代器，生成器
1. 迭代器迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...
Python迭代器和生成器你学会了吗？
在了解什么是迭代器和生成器之前,我们先来了解一下容器的概念.对于一切皆对象来说,容器就是对象的集合.例如列表.元祖.字典等等都是容器.对于容器,你可以很直观地想象成多个元素在一起的单元:而不同容器的区 ...
Python—迭代器与生成器
迭代器与生成器生成器(generator) 先来了解一下列表生成器: list = [i*2 for i in range(10)] print(list)>>>>[0, 2 ...
python -迭代器与生成器以及 iterable（可迭代对象）、yield语句
我刚开始学习编程没多久,对于很多知识还完全不知道,而有些知道的也是一知半解,我想把学习到的知识记录下来,一是弥补记忆力差的毛病,二也是为了待以后知识能进一步理解透彻时再回来做一个补充. 参考链接: 完 ...

随机推荐

Golang-基本语法2
http://c.biancheng.net/golang/syntax/ Go语言变量的声明(使用var关键字) Go语言是静态类型语言,因此变量(variable)是有明确类型的,编译器也会检查变 ...
axios请求拦截器和响应拦截器
axios里面可以设置拦截器 ,在请求发送之前做一些事情: 拦截器分[请求拦截器]和[响应拦截器] 参考地址:https://www.jb51.net/article/150014.htm 参考的地址 ...
Elasticsearch性能优化干货
1.集群规划优化实践 1.1 基于目标数据量规划集群在业务初期,经常被问到的问题,要几个节点的集群,内存.CPU要多大,要不要SSD? 最主要的考虑点是:你的目标存储数据量是多大?可以针对目标数据量 ...
管理虚拟机（libvirt）
给我的理解就是与用户交互的"显示器" [root@kvm1 ~]# systemctl status libvirtd [root@kvm1 ~]# virsh virsh # l ...
本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南
本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南作为AI领域的弄潮儿,你是否苦恼于云端大模型API的高昂成本?想在本机零门槛体验顶尖开源模型?这篇保姆级教程将带你解锁「Olla ...
你还不会使用Pycham Remote development 打开远程主机工作目录吗？这篇文章帮你解决！
前言必备: 本地开发机与远程主机都要安装Pycharm专业版!!! 废话不多说直接开始!! 1.打开pycharm 2.依次点击File.Remote Development 3.依次点击SSH.N ...
c# 删除文件夹最快的函数方法无视占用直接删除
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/17270147.html 代码如下,直接通过cmd调用dos命令进行删除 public stat ...
Git的快速使用
Git的快速使用 git提交到gitee 1.初始化本地仓库 git init 2.拉取远程仓库代码 git clone https://gitee.com/sword-level_0/mount-t ...
thymeleaf的手动渲染HTML模板
thymeleaf的手动渲染HTML模板长河 2018-11-14 11:18:10 6833 收藏 2 分类专栏: Springboot 版权现在很多公司都在thymeleaf作为前端的显示 ...
Edge浏览器网站页面如何设置自动刷新
1.浏览器设置要在Edge浏览器中设置网站页面自动刷新,可以按照以下步骤操作: 打开Edge浏览器,进入你想要自动刷新的网站页面. 在地址栏上方点击"设置和更多选项"(三个水平点 ...

Python 迭代器和生成器概念