Python——第四章:生成器(Generators)
生成器(generator):
生成器的本质就是迭代器
创建生成器的两种方案:
1. 生成器函数
2. 生成器表达式
生成器函数
生成器函数中有一个关键字yield
生成器函数执行的时候, 并不会执行函数, 得到的是生成器.
yield: 只要函数中出现了yield. 它就是一个生成器函数
作用:
1. 可以返回数据
2. 可以分段的执行函数中的内容, 通过__next__()可以执行到下一个yield位置
优势:
用好了, 特别的节省内存
生成器表达式 -> 一次性的
语法: (数据 for循环 if)
正常的函数调用如下:
def func():
print(123456)
return 999
ret = func()
print(ret)
#运行结果
123456
999
使用生成器命令yield替代return。生成器函数执行的时候,并不会执行函数,得到的是生成器。
def func():
print(123456)
yield 999 # yield也有返回的意思.
ret = func()
print(ret)
#运行结果
<generator object func at 0x115f2dbd0>
生成器的本质就是迭代器,因此我们可以用迭代器的模式使用它:
def func():
print(123456)
yield 999 # yield也有返回的意思.
ret = func()
print(ret.__next__()) # yield只有执行到next的时候才会返回数据
#运行结果
123456
999
上面运行结果中:123456是函数的正常执行,999是yield返回的值,也就是说999是print()打印出来的,我们把print()拿掉就可以看到只有123456了
def func():
print(123456)
yield 999 # yield也有返回的意思.
ret = func()
ret.__next__()
#运行结果
123456
因此我们可以发现,yield和return是有一些区别的:return的用法是立即执行函数,并返回数据,而yield是只有执行到next的时候,才会返回数据。
如果我们执行2次next()又会出现和迭代器一样的StopIteration报错
def func():
print(123456)
yield 999 # yield也有返回的意思.
ret = func()
print(ret.__next__()) # yield只有执行到next的时候才会返回数据
print(ret.__next__()) # StopIteration
#运行结果
123456
999
Traceback (most recent call last):
File "D:\迭代器.py", line 8, in <module>
print(ret.__next__()) # StopIteration
^^^^^^^^^^^^^^
StopIteration
这也证明了:" 生成器的本质就是迭代器"
yield可以让程序分段的执行函数中的内容, 通过__next__()可以执行到下一个yield位置
执行一次:
def func():
print(123)
yield 666
print(456)
yield 999
ret = func()
print(ret.__next__())
#运行结果
123
666
执行两次:
def func():
print(123)
yield 666
print(456)
yield 999
ret = func()
print(ret.__next__())
print(ret.__next__())
#运行结果
123
666
456
999
这里yield就明显区别与return:当使用return的时候(比如return 666),return后面的内容全部都不会再执行。
去工厂定制10000件衣服
def order():
lst = []
for i in range(10000):
lst.append(f"衣服{i}")
return lst
lst = order()
print(lst)
简单的for循环会一次性生产出10000件衣服,并且出现了大列表lst[0,1,2,3,……,9999]这样会严重占用内存,并且双方都不好处理。
为此我们使用生成器玩法,让每次出货量为100件,每次执行__next__后再生产100件,这样就非常不占用内存,并且生产压力和库存压力都减少很多。
def order():
lst = []
for i in range(10000):
lst.append(f"衣服{i}")
if len(lst) == 100:
yield lst
# 下一次拿数据
lst = [] #清空计数器重新计数
gen = order()
print(gen.__next__())
print(gen.__next__())
print(gen.__next__())
print(gen.__next__())
还可以用一个列表去接收这些yield的值:
def order():
lst = []
for i in range(10000):
lst.append(f"衣服{i}")
if len(lst) == 100:
yield lst
# 下一次拿数据
lst = [] # 清空计数器重新计数
gen = order()
# 用于追加结果的列表
result_list = []
# 逐次执行生成器并追加结果到列表中
result = next(gen)
result_list.append(result)
result = next(gen)
result_list.append(result)
result = next(gen)
result_list.append(result)
result = next(gen)
result_list.append(result)
# 打印包含所有结果的列表
print(result_list)
以下这段代码,存在的意义就是,使用生成器的yield特性,将程序分段执行,这样就可以避免庞大的数据执行时,严重占用内存的现象。
def order():
lst = []
for i in range(10000):
lst.append(f"衣服{i}")
if len(lst) == 100:
yield lst
# 下一次拿数据
lst = [] # 清空计数器重新计数
gen = order()
# 使用 list() 函数接收生成器的 yield 返回值
result_list = list(gen)
在处理大型数据集或者生成器产生的数据量很大时,一次性获取所有值可能会导致内存占用较大,因为所有值都需要同时存储在内存中。在这种情况下,你可能希望逐个获取生成器的值,以减小内存压力。
如果数据量较大或者你希望逐个获取生成器的值,那么逐次调用 next(gen) 会更有优势!
这就是生成器的存在的价值。
生成器表达式
生成器表达式 -> 一次性的
语法: (数据 for循环 if)
一次一次的获取生成器的返回值
gen = (i**2 for i in range(10))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
#执行结果
0
1
4
9
因为生成器本质就是迭代器,可以被for循环迭代,因此:
gen = (i**2 for i in range(10))
for item in gen:
print(item)
#执行结果
0
1
4
9
16
25
36
49
64
81
如果要把所有的数据拿出来变成列表,就可以直接用list()套上操作
gen = (i**2 for i in range(10))
lst = list(gen)
print(lst)
#执行结果
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
这里有个隐藏的list循环迭代操作
s = list("周杰伦") # list() => for => next()
print(s)
#执行结果:
['周', '杰', '伦']
这里证明了:list里存在着一个for循环,里面也有遍历所有的next()操作
*****最后这里有个需要注意的地方——如果gen里面的数据全被for循环使用过后,再次使用就是空的
gen = (i**2 for i in range(10))
for item in gen:
pass
lst = list(gen)
print(lst)
#执行结果
[]
生成器表达式是一次性的!只能被用一次!
gen = (i**2 for i in range(10))
print(next(gen))
print(next(gen))
print(next(gen))
lst = list(gen)
print(lst)
#运行结果:
0
1
4
[9, 16, 25, 36, 49, 64, 81]
生成器本身是迭代器。迭代器被print(next(gen))拿过3次后,前三个数(0、1、4)就会消失。仅剩下后面的数据,后面的数据一旦被拿完,gen里面都会被清空。
Python——第四章:生成器(Generators)的更多相关文章
- 简学Python第四章__装饰器、迭代器、列表生成式
Python第四章__装饰器.迭代器 欢迎加入Linux_Python学习群 群号:478616847 目录: 列表生成式 生成器 迭代器 单层装饰器(无参) 多层装饰器(有参) 冒泡算法 代码开发 ...
- [书籍翻译] 《JavaScript并发编程》第四章 使用Generators实现惰性计算
本文是我翻译<JavaScript Concurrency>书籍的第四章 使用Generators实现惰性计算,该书主要以Promises.Generator.Web workers等技术 ...
- Python第四章-字典
第四章 字典-当索引不好用时 4.0 字典可以理解成是C++里的map,可以映射任何类型.字典这种结构类型称为映射(mapping). 字典是Python中唯一内建的映射类型,字典中的值并 ...
- Python第四章实验报告
一.实验项目名称:<零基础学Python>第四章的14道实例和4道实战 二.实验环境:IDLE(Python 3.9 64-bit) 三.实验目的和要求:熟练掌握Python序列的应用 四 ...
- Python 第四篇:生成器、迭代器、装饰器、递归函数与正则表达式
一:生成器:Generator,可以理解为是一种一个函数产生一个迭代器,而迭代器里面的数据是可以通过for循环获取的,那么这个函数就是一个生成器,即生成器是有函数生成的,创建生成器使用()表示,比如g ...
- 新手Python第四天(生成器)
Python 生成器 生成器和生成表达式 a=[i*2 for i in range(10)]#生成表达式 b=(i*2 for i in range(10))#生成器 生成器的特点:优点(不占用内存 ...
- 流畅的python第四章文本和字节序列学习记录
字符问题 把码位转化成字节序列的过程是编码,把字节序列转化成码位的过程是解码 把unicode字符串当成人类可读的文本,码位当成机器可读的, 将字节序列编程人类可读是解码,把字符串编码成字节序列是编码 ...
- Python(四)生成器 和 杨辉三角
学习链接: http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143177992 ...
- Python第四章(北理国家精品课 嵩天等)
一.程序的分支结构 二.身体质量指数BMI #CalBIv1.py height,weight = eval((input("请输入身高(米)和体重\(公斤)[逗号隔开]:"))) ...
- python第四章:函数--小白博客
Python函数 函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段. 函数能提高应用的模块性,和代码的重复利用率.你已经知道Python提供了许多内建函数,比如print().但你也可 ...
随机推荐
- Mac上虚拟环境的安装与使用
Mac上虚拟环境的安装与使用 介绍 virtualenv是python虚拟环境,能够和系统环境相隔离,保持环境的纯净. virtualenvwrapper可以方便管理虚拟环境 安装 pip insta ...
- Python socket实现简单聊天,同步输入和接收消息
查的资料很多都是必须等待接收数据后才能再次输入.做了修改,使用多线程的形式,实现一边输入,一边接收 服务端代码 import socket import threading import sys im ...
- Vue2系列(lqz)——Vue介绍
文章目录 Vue入门 零:前端目前形势 前端的发展史 一:Vue介绍 和 基本使用 1.Vue介绍 渐进式框架 网站 2.Vue特点 易用 灵活 高效 3.M-V-VM思想 ① MVVM介绍 ② MV ...
- Python3 Keras分词器Tokenizer
import keras.preprocessing.sequence from keras.preprocessing.text import Tokenizer samples = ['我 爱 你 ...
- 前端JavaScript编码规范 和react编码规范
JavaScript编码规范 点击链接查看:https://github.com/ecomfe/spec/blob/master/javascript-style-guide.md 前端React编码 ...
- AttributeError: module 'sqlalchemy' has no attribute '__all__'
升级组件 pip install --upgrade flask-sqlalchemy
- mybatis 操作 mysql 动态创建数据表
Map 数据一般是根据需求生成的,例如 map.put("ticketId",176),map.put("ticketName","测试工单" ...
- 基于AStyle的代码格式化脚本 [已开源]
这是一个简单的windows端脚本 主要用于C/C++代码的格式化 可以添加到鼠标右键,直接在.C/.H文件上右键格式化代码 具体开源地址 https://gitee.com/svchao/code_ ...
- hci0 command 0xfc20 tx timeout(Realtek 8761B Chipset, Bluetooth 5.0)
当前使用的Linux内核版本: 4.4.189 插上USB Bluetooth 5.0 Adapter后,dmesg显示如下log: [ 240.348480] usb 3-1.2: new full ...
- Pandas 分组聚合操作详解
Pandas 是 Python 中用于数据分析的重要工具,它提供了丰富的数据操作方法.在数据分析过程中,经常需要对数据进行分组聚合操作.本文将介绍 Pandas 中的数据分组方法以及不同的聚合操作,并 ...