- Java锁的逻辑(结合对象头和ObjectMonitor)
- 还在用饼状图?来瞧瞧这些炫酷的百分比可视化新图形(附代码实现)⛵
- 自动注册实体类到EntityFrameworkCore上下文,并适配ABP及ABPVNext
- 基于Sklearn机器学习代码实战
在本篇文章当中主要给大家介绍 Python 当中生成器的实现原理,尤其是生成器是如何能够被停止执行,而且还能够被恢复的,这是一个非常让人疑惑的地方。因为这与我们通常使用的函数的直觉是相违背的,函数之后执行完成之后才会返回,而生成表面是函数的形式,但是这违背了我们正常的编程直觉.
为了从根本上建立对生成器的认识,我们首先就需要深入理解一下生成器和函数的区别。其实在从虚拟机的层面来看,他们两个都是对象,只不过一个是生成器对象,一个是函数对象。在 Python 当中,如果你在函数里面使用了 yield 语句,那么你的这个函数在被调用的时候就不会被执行,而是会返回一个生成器对象.
>>> def bar():
... print("before yield")
... res = yield 1
... print(f"{res = }")
... print("after yield")
... return "Return Value"
...
>>> generator = bar()
>>> generator
<generator object bar at 0x105267510>
>>> bar
<function bar at 0x10562fc40>
>>>
在 Python 当中有的对象是可以直接调用的,比如你自己的类如果实现了 __call__ 方法的话,这个类生成的对象就是一个可调用对象,在 Python 当中一个最常见的可调用对象就是函数了,生成器和函数的区别之一就是,生成器不能够直接被调用,而函数可以.
>>> generator()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'generator' object is not callable
>>>
在上面的代码当中我们要明确 bar 是一个函数,但是这个函数和正常的函数有一点区别,这个函数在被调用的时候不会直接执行代码,而是会返回一个生成器对象,因为在这个函数体当中使用了 yield 语句,我们称这种函数为生成器函数 (generator function),在 Python 当中你可以通过查看一个函数的 co_flags 字段查看一个函数的属性,如果这个字段和 0x0020 进行 & 操作之后的结果大于 0,那么就说明这个函数是一个生成器函数.
>>> (bar.__code__.co_flags & 0x0020) > 0
True
>>> bar.__code__.co_flags & 0x0020
32
从上面的代码当中我们可以看到 bar 就是一个生成器函数,除了上面的方法 Python 的标准库也提供了方法去辅助我们进行判断.
>>> import inspect
>>> inspect.isgeneratorfunction(bar)
True
上面的特性在 Python 程序进行编译的时候,编译器可以做到这一点,当发现一个函数当中存在类似 yield 的语句的时候就在函数的 co_flags 字段当中和 0x0020 进行或操作,然后将这个值保存在 co_flags 当中.
总之生成器和函数之间的关系为:生成器对象是通过调用生成器函数得到的,调用生成器函数的返回对象是生成器.
首先我们需要了解的是,如果我们想让一个生成器对象执行下去的话,我们可以使用 next 或者 send 函数,进行实现:
>>> next(generator)
before yield
1
>>> next(generator)
res = None
after yield
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration: Return Value
在 CPython 实现的虚拟机当中,如果我们想要正确的使用 send 函数首先需要让生成器对象执行到第一个 yield 语句,我们可以使用 next(generator) 或者 generator.send(None) 。比如在上面的第一条语句当中执行 next(generator) ,运行到语句 res = yield 1 ,但是这条语句还没有执行完,需要我们调用 send 函数之后才能够完成赋值操作,send 函数的参数会被赋值给变量 res 。当整个函数体执行完成之后虚拟机就会抛出 StopIteration 异常,并且将返回值保存到 StopIteration 异常对象当中:
>>> generator = bar()
>>> next(generator)
before yield
1
>>> try:
... generator.send("None")
... except StopIteration as e:
... print(f"{e.value = }")
...
res = 'None'
after yield
e.value = 'Return Value'
>>>
上面的代码当中可以看到,我们正确的执行力我们在上面谈到的生成器的使用方法,并且将生成器执行完成之后的返回值保存到异常的 value 当中.
从上面的关于生成器的使用方式来看,生成器可以在函数执行到一半的时候停止,然后继续恢复执行,为了实现这一点我们就需要有一种手段去保存函数执行的状态。但是我们需要保存函数执行的那些状态呢?最重要的两点就是代码现在执行到什么位置了,因为我们之后要继续从下一条指令开始恢复执行,同时我们需要保存虚拟机的栈空间,就是在执行字节码的时候使用到的 valuestack,注意这不是栈帧,同时还有执行函数的局部变量表,这里主要是保存一些局部变量的。而这些东西都保存在虚拟机的栈帧当中了,这一点我们在前面的文章当中已经详细介绍过了.
因此根据这些分析我们应该知道了,生成器里面最重要的就是一个虚拟机的栈帧数据结构了。一个生成器对象当中一定需要有一个虚拟机的栈帧,在 CPython 的实现当中,生成器对象的数据结构如下:
typedef struct
{
/* The gi_ prefix is intended to remind of generator-iterator. */
PyObject ob_base;
struct _frame *gi_frame;
char gi_running;
PyObject *gi_code;
PyObject *gi_weakreflist;
PyObject *gi_name;
PyObject *gi_qualname;
_PyErr_StackItem gi_exc_state;
} PyGenObject;
class A:
def hello(self):
yield 1
if __name__ == '__main__':
g = A().hello()
print(g.__name__)
print(g.__qualname__)
上面的程序输出结果为
hello
A.hello
我们通过下面的例子来分析一下,生成器 yield 对应的字节码:
>>> import dis
>>> def hello():
... yield 1
... yield 2
...
>>> dis.dis(hello)
2 0 LOAD_CONST 1 (1)
2 YIELD_VALUE
4 POP_TOP
3 6 LOAD_CONST 2 (2)
8 YIELD_VALUE
10 POP_TOP
12 LOAD_CONST 0 (None)
14 RETURN_VALUE
在上面的程序当中只有和生成器相关的字节码为 YIELD_VALUE,在加载完常量 1 之后就会执行 YIELD_VALUE 指令,虚拟机在执行完 yield 指令之后,就会直接返回,此时虚拟机的状态——valuestack 和当前指令执行的位置(在上面的这个例子当中就是 4)都会被保存到虚拟机栈帧当中,当下一次执行生成器的代码的时候就会直接从 POP_TOP 指令直接执行.
我们再来看一下另外一个比较重要的指令 YIELD_FROM
>>> def generator_b(gen):
... yield from gen
...
>>> dis.dis(generator_b)
2 0 LOAD_FAST 0 (gen)
2 GET_YIELD_FROM_ITER
4 LOAD_CONST 0 (None)
6 YIELD_FROM
8 POP_TOP
10 LOAD_CONST 0 (None)
12 RETURN_VALUE
我们现在用一个简单的例子重新回顾一下程序的行为:
def generator_a():
yield 1
yield 2
def generator_b(gen):
yield from gen
if __name__ == '__main__':
gen = generator_b(generator_a())
print(gen.send(None))
print(gen.send(None))
try:
gen.send(None)
except StopIteration:
print("generator exit")
上面的程序输出结果如下所示:
1
2
generator exit
从上面程序的输出结果我们可以看到 generator_a 的两个值都会被返回,这些魔法隐藏在字节码 YIELD_FROM 当中。YIELD_FROM 字节码会调用栈顶上的生成器对象的 send 方法,并且将参数生成器对象 gen 的返回结果返回,比如 1 和 2 这两个值会被返回到 generator_b ,然后 generator_b 会将这个结果继续传播出来.
在本篇文章当中主要分析的生成器内部实现原理和相关的两个重要的字节码,分析了生成器能够停下来还能够恢复执行的原因。本文最重要的两点就是区分函数和生成器和 YIELD 、YIELD_FROM 两个字节码,生成器是生成器函数返回的对象,YIELD 会直接进行函数返回,虚拟机不会继续往下执行,YIELD_FROM 除了会进行函数返回还会将字节码的执行位置往前移动,以保证 YIELD_FROM 下一次还能够被执行.
本篇文章是深入理解 python 虚拟机系列文章之一,文章地址: https://github.com/Chang-LeHung/dive-into-cpython 。
更多精彩内容合集可访问项目: https://github.com/Chang-LeHung/CSCore 。
关注公众号:一无是处的研究僧,了解更多计算机(Java、Python、计算机系统基础、算法与数据结构)知识.
最后此篇关于深入理解python虚拟机:生成器停止背后的魔法的文章就讲到这里了,如果你想了解更多关于深入理解python虚拟机:生成器停止背后的魔法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
也许这是我忽略的某种默认行为,但目前我一点也不知道如何点击http://pinterest.com主页上的一个元素。网址实际上发生了变化,即:http://pinterest.com/pin/6016
我在 ubuntu 上使用 python 2.7 根据documentation我应该能够从 ipython 运行 Octave : %install_ext octavemagic %load_ex
如何在 magick++ 中使用 WhiteThresholdImage? 我搜索它并找到了解决方案,所以我尝试: #include using namespace Magick; int ma
这个问题在这里已经有了答案: C++ array[index] vs index[array] [duplicate] (4 个答案) 关闭 3 年前。 我遇到了一种吸引数组元素的奇怪方式,我认为这
Mr. Lidström and I had an argument :) 先生。 Lidström 的声明是一个构造 shared_ptr p(new Derived);不要求 Base 具有虚拟析
我的 C++ 程序在从 VoIP 数据包中提取音频时遇到问题。 它在 Linux 和 OpenBSD 上的 amd64 和 x86 上运行良好,但是当我在 ARM 上的 OpenBSD 上运行程序时,
在滑动或更改 css 中的任何属性(非内联)之前不显示滑动器的箭头 演示链接:http://sinneren.ru/side/giftormagic/views/index0.html 如何:查看我的
Mr. Lidström and I had an argument :) 先生。 Lidström 声称构造 shared_ptr p(new Derived);不需要 Base 具有虚拟析构函数:
1、向对象显示的发送消息 我们可以向对象直接发送消息: Ruby代码 复制代码 代码如下: class HelloWorld def say(name) print "Hello,
我需要打印一些票,每张票都有足够的空间来保存一组客户详细信息以及该客户订购的最多五件商品的代码。订购超过五件商品的客户将获得多张门票。所以从这样的订单表中, 客户 |元素 ---------|----
我正在尝试调用在 'timex.py' 中定义的一个小辅助函数,它是从 'caller.py' 调用的,而后者又应该通过“%run caller.py”从(PyCharm 的)IPython 控制台调
我是 python 的新手,我正在做一个需要检测文件类型的项目,所以我使用了 magic 库,但是代码不工作,它引发了异常。 测试代码为: import magic magic.from_file("
我正在尝试使用 jupyter 笔记本中的神奇 %qtconsole 。我正在本地连接到远程服务器。 当在笔记本的单元格中输入 %qtconsole 并按 Shift-Enter 时,没有任何反应。没
我竭力修改一些不是我写的旧日志记录代码,想知道您对它的看法。这是一个用 PHP 和 MySQL 编写的事件记录器,记录如下消息: Sarah added a user, slick101 Mike d
最好是像这样进行联合查询: var employer = (from person in db.People join employer in db.Employe
我正在PlainNote应用程序中挖掘source code 。我注意到 appdelegate 文件中没有 rootviewcontroller 的实例。仅将 navigationControlle
我正在双击 UIScrollView 中缩放 UIImageView。在 Interface Builder 中设置后工作正常。我在这里看到的神奇之处在于,当我放大/缩小时,scrollView 的
我正在使用 CUDA(如果差异很重要,实际上我正在使用 pyCUDA)并对数组执行一些计算。我正在启动一个具有 320*600 线程网格的内核。在内核中,我声明了两个包含 20000 个组件的线性数组
如果你这样做 {k:v for k,v in zip(*[iter(x)]*2)} 其中 x 是一个列表,你会得到一个字典,其中所有奇数元素作为键,偶数元素作为它们的值。哇! >>> x = [1,
我刚刚被指派在使用 Umbraco 的项目中实现一项功能。我的工作基本上是生成特定的 XML 并将其返回给用户。但是我无法让它工作,因为当我创建新 Controller 时(我尝试创建 Control
我是一名优秀的程序员,十分优秀!