pac*_*lik 5 python performance python-3.x
创建列表时,我认为只要有可能就建议使用理解式,因为它是最快的。但你瞧。
In [1]: %timeit -n1000 [0]*1000000
1000 loops, best of 3: 2.3 ms per loop
In [2]: %timeit -n1000 [0 for _ in range(1000000)]
1000 loops, best of 3: 27.1 ms per loop
In [3]: a = np.zeros(1000000, dtype=int)
In [4]: %timeit -n1000 a.tolist()
1000 loops, best of 3: 7.93 ms per loop
Run Code Online (Sandbox Code Playgroud)
甚至numpy.ndarray.tolist连乘法都跟不上。这是为什么?
该dis模块对于比较前两种方法很有用。
def list_mult():
return [0]*1000000
dis.dis(list_mult)
# 2 0 LOAD_CONST 1 (0)
# 3 BUILD_LIST 1
# 6 LOAD_CONST 2 (1000000)
# 9 BINARY_MULTIPLY
# 10 RETURN_VALUE
Run Code Online (Sandbox Code Playgroud)
这里BINARY_MULTIPLY使用的是指令。另一方面...
def list_range():
return [0 for _ in range(1000000)]
dis.dis(list_range)
# 2 0 BUILD_LIST 0
# 3 LOAD_GLOBAL 0 (range)
# 6 LOAD_CONST 1 (1000000)
# 9 CALL_FUNCTION 1
# 12 GET_ITER
# >> 13 FOR_ITER 12 (to 28)
# 16 STORE_FAST 0 (_)
# 19 LOAD_CONST 2 (0)
# 22 LIST_APPEND 2
# 25 JUMP_ABSOLUTE 13
# >> 28 RETURN_VALUE
Run Code Online (Sandbox Code Playgroud)
该函数显式构造一个循环,然后在每次迭代中加载 0 并将其附加到工作列表中。这会慢很多。
应该注意的是,这两种构造方法并不等效,特别是当列表内的值是可变的时。例如,[object()] * 10将为您提供 10 个相同对象的列表,而[object() for _ in range(10)]将为您提供 10 个不同对象的列表。
对于这个numpy例子,这个操作是最坏的情况numpy。构造和转换数组会产生大量开销numpy,以便矢量化操作可以很快(如注释中所述)。
| 归档时间: |
|
| 查看次数: |
950 次 |
| 最近记录: |