为什么 mypy FAQ 提到性能影响?

bli*_*bli 5 python mypy

据我了解,mypy这是一个可以检查包含类型注释的Python代码的工具。

然而,在常见问题解答中,我读到了以下内容:

Mypy 只进行静态类型检查,并不能提高性能。它对性能的影响最小。

在第二句话中,“最小”似乎意味着对性能有影响(尽管很小)

为什么 mypy 会影响性能?我认为最终,代码仍然必须由 python 解释器运行,因此 mypy(或任何其他分析代码的工具,如 flake8 或 pylint)不应该对性能产生任何正面或负面的影响。

是因为额外的类型注释导致源代码体积较大吗?

Mar*_*ers 6

常见问题解答讨论了 Python 代码的性能。

在某些编程语言中,类型提示可以帮助引导即时编译器更有效地编译提示代码,从而提高性能。在 Python 中,情况并非如此,语言运行时不使用类型提示,这些提示只不过被视为元数据。

最小的性能影响来自运行提示定义(导入、TypeVar分配和解释注释本身)所需的额外字节码。即使重复创建类和函数,这种影响确实很小。

您可以通过在代码运行中使用类型提示来使影响可见exec();这是一个极端的情况,我们为执行很少的代码添加了更多的开销:

>>> import timeit
>>> without_hints = compile("""def foo(bar): pass""", "", "exec")
>>> with_hints = compile(
...     "from typing import List\ndef foo(bar: List[int]) -> None: pass",
...     "", "exec")
>>> without_metrics = timeit.Timer('exec(s)', 'from __main__ import without_hints as s').autorange()
>>> with_metrics = timeit.Timer('exec(s)', 'from __main__ import with_hints as s').autorange()
>>> without_metrics[1] / without_metrics[0] * (10e6)
4.217094169580378
>>> with_metrics[1] / with_metrics[0] * (10e6)   # microseconds per execution
19.113581199781038
Run Code Online (Sandbox Code Playgroud)

因此,添加类型提示会增加约 15 微秒的执行时间,因为 Python 必须List从 导入对象typing,并将提示附加到创建的函数对象。

对于模块顶层定义的任何内容来说,15 微秒是最小的,只需导入一次。

当您反汇编生成的字节码时,您可以看到这一点。比较没有提示的版本:

>>> dis.dis(without_hints)
  1           0 LOAD_CONST               0 (<code object foo at 0x10ace99d0, file "<dis>", line 1>)
              2 LOAD_CONST               1 ('foo')
              4 MAKE_FUNCTION            0
              6 STORE_NAME               0 (foo)
              8 LOAD_CONST               2 (None)
             10 RETURN_VALUE

Disassembly of <code object foo at 0x10ace99d0, file "<dis>", line 1>:
  1           0 LOAD_CONST               0 (None)
              2 RETURN_VALUE
Run Code Online (Sandbox Code Playgroud)

与暗示的版本:

>>> import dis
>>> dis.dis(with_hints)
  1           0 LOAD_CONST               0 (0)
              2 LOAD_CONST               1 (('List',))
              4 IMPORT_NAME              0 (typing)
              6 IMPORT_FROM              1 (List)
              8 STORE_NAME               1 (List)
             10 POP_TOP

  2          12 LOAD_NAME                1 (List)
             14 LOAD_NAME                2 (int)
             16 BINARY_SUBSCR
             18 LOAD_CONST               2 (None)
             20 LOAD_CONST               3 (('bar', 'return'))
             22 BUILD_CONST_KEY_MAP      2
             24 LOAD_CONST               4 (<code object foo at 0x10ace99d0, file "<dis>", line 2>)
             26 LOAD_CONST               5 ('foo')
             28 MAKE_FUNCTION            4 (annotations)
             30 STORE_NAME               3 (foo)
             32 LOAD_CONST               2 (None)
             34 RETURN_VALUE

Disassembly of <code object foo at 0x10ace99d0, file "<dis>", line 2>:
  2           0 LOAD_CONST               0 (None)
              2 RETURN_VALUE
Run Code Online (Sandbox Code Playgroud)

Python 3.7 引入了PEP 563 - 延迟评估注释,旨在稍微降低此成本并使前向引用更容易。对于上面过于简化的示例,这实际上并没有减少所需的时间,因为加载预定义的注释也需要一些时间:

>>> pep563 = compile(
...     "from __future__ import annotations\nfrom typing import List\ndef foo(bar: List[int]) -> None: pass",
...     "", "exec")
>>> pep563_metrics = timeit.Timer('exec(s)', 'from __main__ import pep563 as s').autorange()
>>> pep563_metrics[1] / pep563_metrics[0] * (10e6)   # microseconds per execution
19.314851402305067
Run Code Online (Sandbox Code Playgroud)

但对于更复杂的、现实生活中的类型提示项目,这确实会产生很小的差异。