为什么具有相同数据的列表具有不同的大小？

Question

为什么具有相同数据的列表具有不同的大小？

Vla*_*lav 10 python list python-2.7 python-internals

假设我lists以两种方式创建python .

在第一种情况下,我使用简单的赋值:

my_list = []
print(my_list, '->', my_list.__sizeof__())
my_list = [1]
print(my_list, '->', my_list.__sizeof__())
my_list = [1, 1]
print(my_list, '->', my_list.__sizeof__())

Run Code Online (Sandbox Code Playgroud)

在第二种情况下,我使用append()列表上的方法:

my_list = []
print(my_list, '->', my_list.__sizeof__())
my_list.append(1)
print(my_list, '->', my_list.__sizeof__())
my_list.append(1)
print(my_list, '->', my_list.__sizeof__())

Run Code Online (Sandbox Code Playgroud)

但我得到了意想不到的(对我来说)输出:

=== WITH ASSIGNMENT ===
([], '->', 40)
([1], '->', 48)
([1, 1], '->', 56)
=== WITH APPEND ===
([], '->', 40)
([1], '->', 72)
([1, 1], '->', 72)

Run Code Online (Sandbox Code Playgroud)

Python内存管理内部会发生什么？为什么"相同"列表的大小不同？

Answer 1

Mos*_*oye 17

当您附加到列表时,出于性能原因,内存被过度分配到列表中,因此多个附加不需要对列表进行相应的内存重新分配,这会在重复附加的情况下降低整体性能.

CPython源代码在评论中清楚地描述了这种行为:

/* This over-allocates proportional to the list size, making room
 * for additional growth.  The over-allocation is mild, but is
 * enough to give linear-time amortized behavior over a long
 * sequence of appends() in the presence of a poorly-performing
 * system realloc().
 * The growth pattern is:  0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...
 * Note: new_allocated won't overflow because the largest possible value
 *       is PY_SSIZE_T_MAX * (9 / 8) + 6 which always fits in a size_t.
 */

Run Code Online (Sandbox Code Playgroud)

在另一种情况下,列表是从文字构造的,列表的大小反映了容器本身的大小以及对每个包含对象的引用.

确切的分配行为可以与其它Python实现而变化(参见list.append用于实现的Jython和PyPy)和过度分配不能保证存在.

归档时间：	8 年，4 月前
查看次数：	320 次
最近记录：	7 年，7 月前