Python 迭代器和生成器概念
迭代器的介绍
迭代器的定义:
迭代器(Iterator)是 Python 中用于遍历数据集合的核心机制。它提供了一种统一的方式来访问容器(如列表、字典、文件等)中的元素,而无需关心底层数据结构的具体实现。迭代器的核心特点是按需生成数据,避免一次性加载所有数据到内存。
迭代器适合处理大型数据、无限序列或需要惰性计算的场景。
迭代器的核心概念:
迭代器协议:
- 一个对象要成为迭代器,必须实现以下两个方法:
__iter__():返回迭代器对象本身(通常直接return self)。__next__():返回下一个元素,若没有更多元素则抛出StopIteration异常。
- Python 的
for循环、next()函数等底层都依赖这一协议。
- 一个对象要成为迭代器,必须实现以下两个方法:
可迭代对象(Iterable) VS 迭代器(Iterator):
- 可迭代对象:实现了
__iter__()方法,可以返回一个迭代器的对象(如列表、元组、字典)。 - 迭代器:实现了
__iter__()和__next__()方法的对象。 - 所有迭代器都是可迭代对象,但可迭代对象本身不一定是迭代器。
差异体现在遍历机制:
可迭代对象:
每次调用iter()会生成新的迭代器,因此可被多次遍历:my_list = [1, 2, 3]
for x in my_list: print(x) # 输出 1,2,3
for x in my_list: print(x) # 再次输出 1,2,3
迭代器:
遍历是一次性的,遍历完成后无法重置:iterator = iter(my_list)
for x in iterator: print(x) # 输出 1,2,3
for x in iterator: print(x) # 无输出(迭代器已耗尽)
- 可迭代对象:实现了
自定义迭代器
示例 1: 通过类实现迭代器
class CountUpTo:
def __init__(self, max_num):
self.max_num = max_num
self.current = 0
def __iter__(self):
return self # 返回迭代器本身
def __next__(self):
if self.current < self.max_num:
self.current += 1
return self.current
else:
raise StopIteration # 终止迭代
# 使用自定义迭代器
counter = CountUpTo(3)
for num in counter:
print(num) # 输出 1, 2, 3
示例 2: 通过生成器函数实现(简化版)
生成器函数(使用 yield)是创建迭代器的快捷方式:
def count_up_to(max_num):
current = 0
while current < max_num:
current += 1
yield current
# 生成器返回的也是迭代器
for num in count_up_to(3):
print(num) # 输出 1, 2, 3
省略的迭代器
写过for循环的都知道,我没用迭代器呀!
用了!只不过是编译器帮你用了。
以下两段代码完全等价:
# 直接遍历列表
my_list = [1, 2, 3, 4, 5]
for x in my_list:
print(x)
# 等价的手动迭代器操作
iterator = iter(my_list) # 自动调用 __iter__() 获取迭代器
while True:
try:
x = next(iterator) # 自动调用 __next__()
print(x)
except StopIteration:
break # 自动处理终止
为什么不需要显式写迭代器?
语法糖(Syntactic Sugar):for 循环是 Python 提供的一种简化语法,隐藏了迭代器的创建和异常处理细节。
统一接口:所有可迭代对象(如列表、元组、字典、集合、字符串等)都可以通过 for 循环统一处理,无需关心底层是列表还是其他数据结构。
生产器的介绍
yield是个英文动词,也是名词,含义是生产的意思。

yield 在 Python里就是生成器。
yield的定义:
Python 的 yield 关键字用于定义生成器函数(Generator Function),生成器是一种特殊的迭代器,能够按需生成值并暂停/恢复执行状态。它的核心特性是惰性求值(Lazy Evaluation),适用于处理大数据流、无限序列或需要节省内存的场景。
核心概念:
生成器函数:
- 使用
yield代替return的函数。 - 调用生成器函数时,返回一个生成器对象(迭代器),而非直接执行函数体。
- 生成器通过
next()或for循环逐步执行,每次遇到yield时暂停,返回yield后的值,并在下次调用时从暂停处继续执行。
- 使用
与普通函数的区别:
- 普通函数一次执行完毕,返回一个结果。
- 生成器函数逐步产生多个值,并在
yield处保持状态。
与 return 的区别:
| 特性 | yield |
return |
|---|---|---|
| 返回值数量 | 可多次返回值 | 仅返回一次 |
| 函数状态 | 暂停并保留状态 | 终止函数执行 |
| 返回类型 | 生成器对象(迭代器) | 直接返回值 |
| 内存占用 | 低(按需生成) | 高(一次性生成所有数据) |
yield的普通用法
示例 1: 简单生成器
def simple_generator():
yield 1
yield 2
yield 3
gen = simple_generator()
print(next(gen)) # 输出 1
print(next(gen)) # 输出 2
print(next(gen)) # 输出 3
# 继续调用 next(gen) 会抛出 StopIteration 异常
示例 2: 用 for 循环遍历生成器
def count_up_to(n):
i = 0
while i < n:
yield i
i += 1
for num in count_up_to(5):
print(num) # 输出 0, 1, 2, 3, 4
yield的高级用法
通过
send()传递值
生成器可以通过send(value)接收外部传入的值,赋值给yield表达式:def generator_with_send():
value = yield "Ready to receive"
yield f"Received: {value}" gen = generator_with_send()
print(next(gen)) # 输出 "Ready to receive"
print(gen.send("Hello")) # 输出 "Received: Hello"
yield from委托生成
Python 3.3+ 引入yield from,用于简化嵌套生成器的操作:def sub_generator():
yield "A"
yield "B" def main_generator():
yield from sub_generator()
yield "C" for item in main_generator():
print(item) # 输出 A, B, C
异常处理
生成器可以通过throw()方法接收异常:def generator_with_exception(value):
try:
yield 10 / value
except ZeroDivisionError as e:
yield "Caught ValueError" gen = generator_with_exception(2)
print(next(gen)) gen = generator_with_exception(0)
print(next(gen))
out:
5.0
Caught ValueError
yidle的实际应用案例
大数据处理:
def read_large_file(file_path):
with open(file_path, "r") as file:
for line in file:
yield line.strip() # 逐行生成,避免一次性加载到内存 for line in read_large_file("data.txt"):
process(line)
生成无限序列:
def fibonacci():
a, b = 0, 1
while True:
yield a
a, b = b, a + b fib = fibonacci()
print([next(fib) for _ in range(10)]) # 前10个斐波那契数
协程(Coroutine):
def coroutine():
while True:
task = yield
print(f"Processing: {task}") worker = coroutine()
next(worker) # 启动协程
worker.send("Task1") # 输出 "Processing: Task1"
worker.send("Task2") # 输出 "Processing: Task2"
在 Python 中,协程(Coroutine) 是一种可以暂停和恢复执行的函数,它能与调用方进行双向通信(接收和发送数据),常用于实现协作式多任务(非抢占式任务切换)。
上文提供的代码是一个典型的基于生成器的协程(Generator-based Coroutine)。
总结
yield 是 Python 中实现惰性计算和协程的核心工具,结合 send()、throw()、close() 等方法,能够构建高效、灵活的数据流和控制流模型。
Python 迭代器和生成器概念的更多相关文章
- Python 迭代器和生成器(转)
Python 迭代器和生成器 在Python中,很多对象都是可以通过for语句来直接遍历的,例如list.string.dict等等,这些对象都可以被称为可迭代对象.至于说哪些对象是可以被迭代访问的, ...
- 一文搞懂Python迭代器和生成器
很多童鞋搞不懂python迭代器和生成器到底是什么?它们之间又有什么样的关系? 这篇文章就是要用最简单的方式让你理解Python迭代器和生成器! 1.迭代器和迭代过程 维基百科解释道: 在Python ...
- Python - 迭代器与生成器 - 第十三天
Python 迭代器与生成器 迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式. 迭代器是一个可以记住遍历的位置的对象. 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问 ...
- 怎么理解Python迭代器与生成器?
怎么理解Python迭代器与生成器?在Python中,使用for ... in ... 可以对list.tuple.set和dict数据类型进行迭代,可以把所有数据都过滤出来.如下: ...
- Python迭代器,生成器--精华中的精华
1. 迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...
- python迭代器与生成器详解
迭代器与生成器 迭代器(iterator)与生成器(generator)是 Python 中比较常用又很容易混淆的两个概念,今天就把它们梳理一遍,并举一些常用的例子. for 语句与可迭代对象(ite ...
- python迭代器,生成器
1. 迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大 ...
- Python迭代器和生成器你学会了吗?
在了解什么是迭代器和生成器之前,我们先来了解一下容器的概念.对于一切皆对象来说,容器就是对象的集合.例如列表.元祖.字典等等都是容器.对于容器,你可以很直观地想象成多个元素在一起的单元:而不同容器的区 ...
- Python—迭代器与生成器
迭代器与生成器 生成器(generator) 先来了解一下列表生成器: list = [i*2 for i in range(10)] print(list)>>>>[0, 2 ...
- python -迭代器与生成器 以及 iterable(可迭代对象)、yield语句
我刚开始学习编程没多久,对于很多知识还完全不知道,而有些知道的也是一知半解,我想把学习到的知识记录下来,一是弥补记忆力差的毛病,二也是为了待以后知识能进一步理解透彻时再回来做一个补充. 参考链接: 完 ...
随机推荐
- Golang-基本语法2
http://c.biancheng.net/golang/syntax/ Go语言变量的声明(使用var关键字) Go语言是静态类型语言,因此变量(variable)是有明确类型的,编译器也会检查变 ...
- axios请求拦截器和响应拦截器
axios里面可以设置拦截器 ,在请求发送之前做一些事情: 拦截器分[请求拦截器]和[响应拦截器] 参考地址:https://www.jb51.net/article/150014.htm 参考的地址 ...
- Elasticsearch性能优化干货
1.集群规划优化实践 1.1 基于目标数据量规划集群 在业务初期,经常被问到的问题,要几个节点的集群,内存.CPU要多大,要不要SSD? 最主要的考虑点是:你的目标存储数据量是多大?可以针对目标数据量 ...
- 管理虚拟机(libvirt)
给我的理解就是与用户交互的"显示器" [root@kvm1 ~]# systemctl status libvirtd [root@kvm1 ~]# virsh virsh # l ...
- 本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南
本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南 作为AI领域的弄潮儿,你是否苦恼于云端大模型API的高昂成本?想在本机零门槛体验顶尖开源模型?这篇保姆级教程将带你解锁「Olla ...
- 你还不会使用Pycham Remote development 打开远程主机工作目录吗?这篇文章帮你解决!
前言 必备: 本地开发机与远程主机都要安装Pycharm专业版!!! 废话不多说直接开始!! 1.打开pycharm 2.依次点击File.Remote Development 3.依次点击SSH.N ...
- c# 删除文件夹最快的函数方法 无视占用 直接删除
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/17270147.html 代码如下,直接通过cmd调用dos命令进行删除 public stat ...
- Git的快速使用
Git的快速使用 git提交到gitee 1.初始化本地仓库 git init 2.拉取远程仓库代码 git clone https://gitee.com/sword-level_0/mount-t ...
- thymeleaf的手动渲染HTML模板
thymeleaf的手动渲染HTML模板 长河 2018-11-14 11:18:10 6833 收藏 2 分类专栏: Springboot 版权 现在很多公司都在thymeleaf作为前端的显示 ...
- Edge浏览器网站页面如何设置自动刷新
1.浏览器设置 要在Edge浏览器中设置网站页面自动刷新,可以按照以下步骤操作: 打开Edge浏览器,进入你想要自动刷新的网站页面. 在地址栏上方点击"设置和更多选项"(三个水平点 ...