文章目录
一、什么是生成器
生成器是一种特殊的迭代器。他也是一个可迭代对象。它主要有以下几个特点:
- 生成器作为一个可迭代对象,可以像列表一样用for语句循环调用取值。[1.1]
- 虽然可以用for循环取值,但是只能取一次,无法像列表一样重复使用。[1.2]
- 生成器数据无法像列表一样直接任意调用某一项数据,例如:一个长度为10的List列表我可以直接调用a = List[7]来赋值,但生成器只能用for语句逐项取用。[1.3]
1.1 生成器,使用for语句
举例:
list_test = [i for i in range(5)]
print('列表输出')
for j in list_test:
print(j)
print('**********')
generator_test = (i for i in range(5))
print('生成器输出')
for j in generator_test:
print(j)
输出:
列表输出
0
1
2
3
4
**********
生成器输出
0
1
2
3
4
输出的结果都是一样的。
1.2 生成器,所有项只能取一次
举例:
generator_test = (i for i in range(5))
print('生成器第一次输出')
for j in generator_test:
print(j)
print('生成器第二次输出')
for j in generator_test:
print(j)
输出:
生成器第一次输出
0
1
2
3
4
生成器第二次输出
第二次输出是没有值的,因为生成器的数据只能取用一次。
1.3 生成器,无法任意取其中一项数据
示例:
list_test = [i for i in range(5)]
print('列表可以取第二项')
print(list_test[1])
print('**********')
generator_test = (i for i in range(5))
print('生成器直接取第二项会报错')
print(generator_test[1])
输出:
列表可以取第二项
1
**********
生成器直接取第二项会报错
Traceback (most recent call last):
File "C:\Users\Ju_Long\Desktop\Python\example.py", line 10, in <module>
print(generator_test[1])
TypeError: 'generator' object is not subscriptable
无法直接取用数值
1.2 为什么要使用生成器
从1.3章节可以看出,生成器产生的数据不是一次性全部生成出来,而是使用一个,再生成一个,可以节约大量的内存。有兴趣的可以尝试一下下面代码的区别:
import time
start_time = time.time()
list_test = [i for i in range(10000000)]
stop_time = time.time()
print('Consumption of time for creating a list: {}'.format(stop_time - start_time))
start_time = time.time()
generator_test = (i for i in range(10000000))
stop_time = time.time()
print('Consumption of time for creating a generator: {}'.format(stop_time - start_time))
输出:
Consumption of time for creating a list: 0.7739417552947998
Consumption of time for creating a generator: 0.0
多消耗的这些时间就是为了创建数据并写入内存。可以看出不仅耗时还耗内存。
二、生成器的创建与使用
创建生成器有以下两种方式:
2.1 推导式列表,创建生成器
参照章节1.1中的代码,注意区分:创建列表用的是[]
,创建生成器用的是()
list_test = [i for i in range(5)]
print('列表输出')
for j in list_test:
print(j)
print('**********')
generator_test = (i for i in range(5))
print('生成器输出')
for j in generator_test:
print(j)
输出:
列表输出
0
1
2
3
4
**********
生成器输出
0
1
2
3
4
2.2 用yield关键字,创建生成器
只要在函数中看到了yield这个关键字那就是生成器,代码示例:
def generator_test(n):
for i in range(n):
print(f"开始第{i}次生成...")
yield i
print(f"完成第{i}次生成...")
generator_instance = generator_test(5)
return_val_1 = next(generator_instance)
print(f'第一次取值为:{return_val_1}')
print('*' * 10, '\n')
return_val_2 = next(generator_instance)
print(f'第一次取值为:{return_val_2}')
print('*' * 10, '\n')
return_val_3 = next(generator_instance)
print(f'第一次取值为:{return_val_3}')
print('*' * 10, '\n')
return_val_4 = next(generator_instance)
print(f'第一次取值为:{return_val_4}')
print('*' * 10, '\n')
return_val_5 = next(generator_instance)
print(f'第一次取值为:{return_val_5}')
print('*' * 10, '\n')
输出:
开始第0次生成...
第一次取值为:0
**********
完成第0次生成...
开始第1次生成...
第一次取值为:1
**********
完成第1次生成...
开始第2次生成...
第一次取值为:2
**********
完成第2次生成...
开始第3次生成...
第一次取值为:3
**********
完成第3次生成...
开始第4次生成...
第一次取值为:4
**********
上述代码中我们用到了next()来逐项取迭代器(在这里是生成器)的值。我们可以看到当生成器每次运行到yield时都会停止并返回当前的i
值(有些类似于IDE软件调试功能的中断,yield相当于在生成器内部打了一个中断标签,每次运行到这里都会停下)并等待下次next()调用。当下次next()调用来临时,我们会继续从上次停下的地方(也就是yield关键词所在)开始运行。
每次取值的对应关系如下:
有时我们会有如下疑问:
后面还有send(msg)的使用,可以参照——参考文献[2]