Python生成器教程:深入理解yield功能

文章目录

  • 一、什么是生成器
  • 1.1 生成器,使用for语句
  • 1.2 生成器,所有项只能取一次
  • 1.3 生成器,无法任意取其中一项数据
  • 1.2 为什么要使用生成器
  • 二、生成器的创建与使用
  • 2.1 推导式列表,创建生成器
  • 2.2 用yield关键字,创建生成器
  • 参考文章

  • 一、什么是生成器

      生成器是一种特殊的迭代器。他也是一个可迭代对象。它主要有以下几个特点:

    1. 生成器作为一个可迭代对象,可以像列表一样用for语句循环调用取值。[1.1]
    2. 虽然可以用for循环取值,但是只能取一次,无法像列表一样重复使用。[1.2]
    3. 生成器数据无法像列表一样直接任意调用某一项数据,例如:一个长度为10的List列表我可以直接调用a = List[7]来赋值,但生成器只能用for语句逐项取用。[1.3]

    1.1 生成器,使用for语句

      举例:

    list_test = [i for i in range(5)]
    print('列表输出')
    for j in list_test:
        print(j)
    print('**********')
    generator_test = (i for i in range(5))
    print('生成器输出')
    for j in generator_test:
        print(j)
    

      输出:

    列表输出
    0
    1
    2
    3
    4
    **********
    生成器输出
    0
    1
    2
    3
    4
    

      输出的结果都是一样的。

    1.2 生成器,所有项只能取一次

      举例:

    generator_test = (i for i in range(5))
    print('生成器第一次输出')
    for j in generator_test:
        print(j)
    print('生成器第二次输出')
    for j in generator_test:
        print(j)
    

      输出:

    生成器第一次输出
    0
    1
    2
    3
    4
    生成器第二次输出
    

      第二次输出是没有值的,因为生成器的数据只能取用一次。

    1.3 生成器,无法任意取其中一项数据

      示例:

    list_test = [i for i in range(5)]
    print('列表可以取第二项')
    print(list_test[1])
    print('**********')
    generator_test = (i for i in range(5))
    print('生成器直接取第二项会报错')
    print(generator_test[1])
    

      输出:

    列表可以取第二项
    1
    **********
    生成器直接取第二项会报错
    Traceback (most recent call last):
      File "C:\Users\Ju_Long\Desktop\Python\example.py", line 10, in <module>
        print(generator_test[1])
    TypeError: 'generator' object is not subscriptable
    

      无法直接取用数值

    1.2 为什么要使用生成器

      从1.3章节可以看出,生成器产生的数据不是一次性全部生成出来,而是使用一个,再生成一个,可以节约大量的内存。有兴趣的可以尝试一下下面代码的区别:

    import time
    
    start_time = time.time()
    list_test = [i for i in range(10000000)]
    stop_time = time.time()
    print('Consumption of time for creating a list: {}'.format(stop_time - start_time))
    
    start_time = time.time()
    generator_test = (i for i in range(10000000))
    stop_time = time.time()
    print('Consumption of time for creating a generator: {}'.format(stop_time - start_time))
    

      输出:

    Consumption of time for creating a list: 0.7739417552947998
    Consumption of time for creating a generator: 0.0
    

      多消耗的这些时间就是为了创建数据并写入内存。可以看出不仅耗时还耗内存。

    二、生成器的创建与使用

      创建生成器有以下两种方式:

    2.1 推导式列表,创建生成器

      参照章节1.1中的代码,注意区分:创建列表用的是[],创建生成器用的是()

    list_test = [i for i in range(5)]
    print('列表输出')
    for j in list_test:
        print(j)
    print('**********')
    generator_test = (i for i in range(5))
    print('生成器输出')
    for j in generator_test:
        print(j)
    

      输出:

    列表输出
    0
    1
    2
    3
    4
    **********
    生成器输出
    0
    1
    2
    3
    4
    

    2.2 用yield关键字,创建生成器

      只要在函数中看到了yield这个关键字那就是生成器,代码示例:

    def generator_test(n):
        for i in range(n):
            print(f"开始第{i}次生成...")
            yield i
            print(f"完成第{i}次生成...")
    
    generator_instance = generator_test(5)
    
    return_val_1 = next(generator_instance)
    print(f'第一次取值为:{return_val_1}')
    print('*' * 10, '\n')
    
    return_val_2 = next(generator_instance)
    print(f'第一次取值为:{return_val_2}')
    print('*' * 10, '\n')
    
    return_val_3 = next(generator_instance)
    print(f'第一次取值为:{return_val_3}')
    print('*' * 10, '\n')
    
    return_val_4 = next(generator_instance)
    print(f'第一次取值为:{return_val_4}')
    print('*' * 10, '\n')
    
    return_val_5 = next(generator_instance)
    print(f'第一次取值为:{return_val_5}')
    print('*' * 10, '\n')
    

      输出:

    开始第0次生成...
    第一次取值为:0
    ********** 
    
    完成第0次生成...
    开始第1次生成...
    第一次取值为:1
    ********** 
    
    完成第1次生成...
    开始第2次生成...
    第一次取值为:2
    ********** 
    
    完成第2次生成...
    开始第3次生成...
    第一次取值为:3
    ********** 
    
    完成第3次生成...
    开始第4次生成...
    第一次取值为:4
    ********** 
    

      上述代码中我们用到了next()来逐项取迭代器(在这里是生成器)的值。我们可以看到当生成器每次运行到yield时都会停止并返回当前的i值(有些类似于IDE软件调试功能的中断,yield相当于在生成器内部打了一个中断标签,每次运行到这里都会停下)并等待下次next()调用。当下次next()调用来临时,我们会继续从上次停下的地方(也就是yield关键词所在)开始运行。

      每次取值的对应关系如下:

      有时我们会有如下疑问:


      后面还有send(msg)的使用,可以参照——参考文献[2]


    参考文章

    1. Python中的生成器
    2. 彻底理解Python中的yield

    作者:julong187

    物联沃分享整理
    物联沃-IOTWORD物联网 » Python生成器教程:深入理解yield功能

    发表回复