Key*_*Usr 2 python bytecode function disassembly
想象一下这个简单的函数创建一个变量的修改值default,modified:
default = 0
def modify():
    modified = default + 1
    print(modified)  # replace with OS call, I can't see the output
modify()  # 1
default  # 0
拆解:
import dis
dis.dis(modify)
2           0 LOAD_GLOBAL              0 (default)
            3 LOAD_CONST               1 (1)
            6 BINARY_ADD
            7 STORE_FAST               0 (modified)
3          10 LOAD_GLOBAL              1 (print)
           13 LOAD_FAST                0 (modified)
           16 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
           19 POP_TOP
           20 LOAD_CONST               0 (None)
           23 RETURN_VALUE
我不能改变这个功能modify(),但我知道它的内容是直接(我可以看到代码)还是间接(反汇编).我需要它是获取modified变量的值,所以我可能有一种方法如何print(modified)通过dis模块删除函数的特定部分(),但我没有找到任何东西.
有没有什么办法可以删除除了return_value之后的所有东西,16 CALL_FUNCTION并用例如替换它return modified?或者有没有其他方法如何拉出局部变量而不实际执行最后一行?
作为可能的解决方案,我看到3种方式:
16 ...)modified(不幸的是调用OS函数)我想避免第二种方式,这可能比第一种方式更容易,但我必须避免第三种方式,所以...有什么方法可以解决我的问题?
有第四种选择:替换print()全局:
printed = []
print = lambda *args: printed.extend(args)
modify()
del print
modified = printed[0]
否则可能会生成修改后的字节码,但这很容易导致破坏解释器的错误(无效字节码没有保护),因此请注意.
您可以使用带有更新字节码的新代码对象创建新的函数对象; 基于你展示的dis中的偏移量,我手动创建了新的字节码,它将返回索引0处的局部变量:
>>> altered_bytecode = modify.__code__.co_code[:8] + bytes(
...     [dis.opmap['LOAD_FAST'], 0,   # load local variable 0 onto the stack
...      dis.opmap['RETURN_VALUE']])) # and return it.
>>> dis.dis(altered_bytecode)
          0 LOAD_GLOBAL              0 (0)
          2 LOAD_CONST               1 (1)
          4 BINARY_ADD
          6 STORE_FAST               0 (0)
          8 LOAD_FAST                0 (0)
         10 RETURN_VALUE
RETURN_VALUE返回堆栈顶部的对象; 我所做的就是注入一个LOAD_FAST操作码来加载modified堆栈上的引用.
您必须创建一个新code对象,然后创建一个function包装代码对象的新对象,以使其可调用:
>>> code = type(modify.__code__)
>>> function = type(modify)
>>> ocode = modify.__code__
>>> new_modify = function(
...     code(ocode.co_argcount, ocode.co_kwonlyargcount, ocode.co_nlocals, ocode.co_stacksize,
...          ocode.co_flags, altered_bytecode,
...          ocode.co_consts, ocode.co_names, ocode.co_varnames, ocode.co_filename,
...          'new_modify', ocode.co_firstlineno, ocode.co_lnotab, ocode.co_freevars,
...          ocode.co_cellvars),
...     modify.__globals__, 'new_modify', modify.__defaults__, modify.__closure__)
>>> new_modify()
1
显然,这确实需要了解Python字节码的工作原理; 该dis模块包含各种代码的描述,dis.opmap字典允许您映射回字节值.
有一些模块试图让这更容易; 如果你想进一步探讨这个项目byteplay的bytecode模块pwnypack或其他几个,请看一下.
我还衷心地建议你观看由Scott Sanderson,Joe Jevnik在PyCon 2016 上发表的使用Python Bytecode演示,并播放他们的codetransformer模块.非常有趣,信息量很大.