为什么三元运算符会快于.get for dicts？

Question

为什么三元运算符会快于.get for dicts？

ewo*_*wok 5 python dictionary python-2.7

我最近发现了令人惊讶的事情.给定一个d不包含密钥的dict k,使用三元运算符尝试检索具有默认返回的项:

>>> def tern():
...     d[k] if k in d else 'foo'
...
>>> timeit.timeit(tern, number=1000000)
0.12342095375061035

Run Code Online (Sandbox Code Playgroud)

运行速度比dict的.get()功能快:

>>> def get_meth():
...     d.get(k, 'foo')
...
>>> timeit.timeit(get_meth, number=1000000)
0.20549297332763672

Run Code Online (Sandbox Code Playgroud)

这对我来说似乎是违反直觉的.我认为三元运算符需要通过dict进行2次搜索(一次测试k in d),然后另一次搜索d[k],而.get只是尝试检索d[k],如果失败则返回'foo'.

我在一个大字典(一百万个元素)和一个小字母(100)上运行它,两次都是三元组明显更快.幕后发生了什么事？

Answer 1

use*_*754 3

如果你反汇编这两个方法，你会发现get有一个额外的方法CALL_FUNCTION，与POP_JUMP_IF_FALSE指令相比，这在 python 中是昂贵的。

如果在

  3           0 LOAD_CONST               1 ('blub')
              3 LOAD_GLOBAL              0 (d)
              6 COMPARE_OP               6 (in)
              9 POP_JUMP_IF_FALSE       22
             12 LOAD_GLOBAL              0 (d)
             15 LOAD_CONST               1 ('blub')
             18 BINARY_SUBSCR       
             19 JUMP_FORWARD             3 (to 25)
        >>   22 LOAD_CONST               2 ('foo')
        >>   25 POP_TOP             
             26 LOAD_CONST               0 (None)
             29 RETURN_VALUE

Run Code Online (Sandbox Code Playgroud)

获取方法：

  6           0 LOAD_GLOBAL              0 (d)
              3 LOAD_ATTR                1 (get)
              6 LOAD_CONST               1 ('blub')
              9 LOAD_CONST               2 ('foo')
             12 CALL_FUNCTION            2          #Expensive call
             15 POP_TOP             
             16 LOAD_CONST               0 (None)
             19 RETURN_VALUE

Run Code Online (Sandbox Code Playgroud)

我不久前读过一篇很长的文章，其中有一节描述了为什么CALL_FUNCTION如此昂贵： https://doughellmann.com/blog/2012/11/12/the-performance-impact-of-using -dict-instead-of-in-cpython-2-7-2/

归档时间：	8 年，1 月前
查看次数：	109 次
最近记录：	8 年，1 月前