为什么列表乘法这么快？

Question

为什么列表乘法这么快？

pac*_*lik 5 python performance python-3.x

创建列表时，我认为只要有可能就建议使用理解式，因为它是最快的。但你瞧。

In [1]: %timeit -n1000 [0]*1000000
1000 loops, best of 3: 2.3 ms per loop

In [2]: %timeit -n1000 [0 for _ in range(1000000)]
1000 loops, best of 3: 27.1 ms per loop

In [3]: a = np.zeros(1000000, dtype=int)

In [4]: %timeit -n1000 a.tolist()
1000 loops, best of 3: 7.93 ms per loop

Run Code Online (Sandbox Code Playgroud)

甚至numpy.ndarray.tolist连乘法都跟不上。这是为什么？

Answer 1

Jar*_*uen 5

该dis模块对于比较前两种方法很有用。

def list_mult():
    return [0]*1000000

dis.dis(list_mult)
#  2           0 LOAD_CONST               1 (0)
#              3 BUILD_LIST               1
#              6 LOAD_CONST               2 (1000000)
#              9 BINARY_MULTIPLY     
#             10 RETURN_VALUE

Run Code Online (Sandbox Code Playgroud)

这里BINARY_MULTIPLY使用的是指令。另一方面...

def list_range():
    return [0 for _ in range(1000000)]

dis.dis(list_range)
# 2           0 BUILD_LIST               0
#             3 LOAD_GLOBAL              0 (range)
#             6 LOAD_CONST               1 (1000000)
#             9 CALL_FUNCTION            1
#            12 GET_ITER            
#       >>   13 FOR_ITER                12 (to 28)
#            16 STORE_FAST               0 (_)
#            19 LOAD_CONST               2 (0)
#            22 LIST_APPEND              2
#            25 JUMP_ABSOLUTE           13
#       >>   28 RETURN_VALUE

Run Code Online (Sandbox Code Playgroud)

该函数显式构造一个循环，然后在每次迭代中加载 0 并将其附加到工作列表中。这会慢很多。

应该注意的是，这两种构造方法并不等效，特别是当列表内的值是可变的时。例如，[object()] * 10将为您提供 10 个相同对象的列表，而[object() for _ in range(10)]将为您提供 10 个不同对象的列表。

对于这个numpy例子，这个操作是最坏的情况numpy。构造和转换数组会产生大量开销numpy，以便矢量化操作可以很快（如注释中所述）。

归档时间：	9 年，6 月前
查看次数：	950 次
最近记录：	6 年，3 月前