gpt4 book ai didi

python - 我应该如何理解 dis.dis 的输出?

转载 作者:IT老高 更新时间:2023-10-28 20:22:12 26 4
gpt4 key购买 nike

我想了解如何使用 dis (the dissembler of Python bytecode) .具体来说,应该如何解释 dis.dis 的输出? (或 dis.disassemble )?

.

这是一个非常具体的例子(在 Python 2.7.3 中):

dis.dis("heapq.nsmallest(d,3)")

0 BUILD_SET 24933
3 JUMP_IF_TRUE_OR_POP 11889
6 JUMP_FORWARD 28019 (to 28028)
9 STORE_GLOBAL 27756 (27756)
12 LOAD_NAME 29811 (29811)
15 STORE_SLICE+0
16 LOAD_CONST 13100 (13100)
19 STORE_SLICE+1

我看到 JUMP_IF_TRUE_OR_POP等等都是字节码指令(虽然有趣的是,BUILD_SET 没有出现在这个列表中,虽然我希望它可以作为 BUILD_TUPLE 工作)。我认为右边的数字是内存分配,左边的数字是goto数字...我注意到它们几乎每次都增加 3(但不完全)。

如果我将 dis.dis("heapq.nsmallest(d,3)") 包装在一个函数中:

def f_heapq_nsmallest(d,n):
return heapq.nsmallest(d,n)

dis.dis("f_heapq(d,3)")

0 BUILD_TUPLE 26719
3 LOAD_NAME 28769 (28769)
6 JUMP_ABSOLUTE 25640
9 <44> # what is <44> ?
10 DELETE_SLICE+1
11 STORE_SLICE+1

最佳答案

您正在尝试反汇编包含源代码的字符串,但 Python 2 中的 dis.dis 不支持该操作。使用字符串参数时,它会将字符串视为包含字节码(请参阅函数 disassemble_string in dis.py )。因此,您会看到基于将源代码误解为字节码的无意义输出。

Python 3 中的情况有所不同,其中 dis.dis compiles a string argument拆机前:

Python 3.2.3 (default, Aug 13 2012, 22:28:10) 
>>> import dis
>>> dis.dis('heapq.nlargest(d,3)')
1 0 LOAD_NAME 0 (heapq)
3 LOAD_ATTR 1 (nlargest)
6 LOAD_NAME 2 (d)
9 LOAD_CONST 0 (3)
12 CALL_FUNCTION 2
15 RETURN_VALUE

在 Python 2 中,您需要自己编译代码,然后再将其传递给 dis.dis:

Python 2.7.3 (default, Aug 13 2012, 18:25:43) 
>>> import dis
>>> dis.dis(compile('heapq.nlargest(d,3)', '<none>', 'eval'))
1 0 LOAD_NAME 0 (heapq)
3 LOAD_ATTR 1 (nlargest)
6 LOAD_NAME 2 (d)
9 LOAD_CONST 0 (3)
12 CALL_FUNCTION 2
15 RETURN_VALUE

这些数字是什么意思?最左边的数字 1 是编译此字节码的源代码中的行号。左边一列的数字是指令在字节码中的偏移量,右边的数字是opargs。我们来看看实际的字节码:

>>> co = compile('heapq.nlargest(d,3)', '<none>', 'eval')
>>> co.co_code.encode('hex')
'6500006a010065020064000083020053'

在字节码的偏移量 0 处,我们找到 65,即 LOAD_NAME 的操作码,其操作参数为 0000;那么(在偏移量 3 处)6a 是操作码 LOAD_ATTR0100 是 oparg,依此类推。请注意,opargs 是小端顺序,因此 0100 是数字 1。未记录的 opcode 模块包含表 opname 为您提供每个操作码的名称,opmap 为您提供每个名称的操作码:

>>> opcode.opname[0x65]
'LOAD_NAME'

oparg 的含义取决于操作码,完整的故事你需要阅读 CPython 虚拟机的实现 in ceval.c .对于 LOAD_NAMELOAD_ATTR,oparg 是代码对象的 co_names 属性的索引:

>>> co.co_names
('heapq', 'nlargest', 'd')

对于 LOAD_CONST,它是代码对象的 co_consts 属性的索引:

>>> co.co_consts
(3,)

对于CALL_FUNCTION,它是传递给函数的参数个数,以16位编码,低字节为普通参数个数,高字节为关键字参数个数.

关于python - 我应该如何理解 dis.dis 的输出?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12673074/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com