对于Python中的gc,动态创建的类总是"无法访问"吗?

Cle*_*aff 6 python garbage-collection

我有一个关于Python中的垃圾收集的问题.在阅读了一些有关为什么人们可能更喜欢运行带有禁用垃圾收集*的Python程序的有见地的文章后,我决定搜索并删除代码中的所有循环引用,以允许通过单独的ref-count来销毁对象.

为了找到现有的循环引用,我在我的unittest案例的tearDown方法中调用了gc.collect(),并在返回值> 0时打印出警告.通过重构或使用弱引用可以轻松解决发现的大多数问题.

过了一会儿,我遇到了一个相当奇怪的问题,最好用代码表达:

import gc
gc.disable()

def bar():
    class Foo( object ):
        pass

bar()
print( gc.collect() ) # prints 6
Run Code Online (Sandbox Code Playgroud)

删除对bar()的调用时,gc.collect()会按预期返回0.

看起来即使Foo是在函数栏的范围内创建的并且永远不会返回到外部,它仍然会使垃圾收集器找到无法访问的对象.

将Foo移到bar的范围之外时,一切正常.但是,该解决方案不适用于我在受影响的代码中尝试解决的问题(动态创建ctypes.Structures用于序列化).

以下两种方法也不起作用:

import gc
gc.disable()

def bar():
    type( "Foo", ( object, ), {} )

bar()
print( gc.collect() ) # prints 6 again
Run Code Online (Sandbox Code Playgroud)

甚至非常'聪明':

import gc
gc.disable()

import weakref

def bar():
    weakref.ref( type( "Foo", ( object, ), {} ) )

bar()
print( gc.collect() ) # still prints 6
Run Code Online (Sandbox Code Playgroud)

最重要的是,这是一个实际工作的例子......但仅限于Python2:

import gc
gc.disable()

def bar():
    class Foo(): # not subclassing object
        pass

bar()
print( gc.collect() ) # prints 0 - finally?
Run Code Online (Sandbox Code Playgroud)

然而,上面的代码再次在Python3中打印出"6" - 我怀疑,因为所有用户定义的类都是Python3中的新式类.

那么,我是否坚持Python2,Python3中奇怪的"无法访问的对象",或者我是否必须通过手动垃圾收集来跟进每次调用bar?

*(关于使用gc.disable()运行Python的文章)

http://pydev.blogspot.de/2014/03/should-python-garbage-collector-be.html http://dsvensson.wordpress.com/2010/07/23/the-garbage-garbage-collector-of -蟒蛇/


请参阅roippi的答案,了解为何上述行为符合预期.

但是为了将来参考,这里有一个小的解决方法,可以解决这个特殊的问题.不是说禁用gc对任何人来说都是正确的,但如果你觉得这对你来说是正确的,那就是我这样做的:

import gc
gc.disable()

def requiresGC( func ):
    def func_wrapper( *args, **kwargs ):
        result = func( *args, **kwargs )
        gc.collect()
        return result
    return func_wrapper

@requiresGC
def bar():
    class Foo( object ):
        pass

bar()
print( gc.collect() ) # prints 0
Run Code Online (Sandbox Code Playgroud)

但请注意,如果bar()是定期调用的函数,则此装饰器将导致显着减速.然而,在我的情况下(序列化),情况并非如此,并且将gc开销包含在一些特定函数中似乎是一种合理的折衷方案.

感谢所有花时间快速回答的人!:-)

roi*_*ppi 4

声明一个新样式的类——无论是静态的还是通过的type——都会创建一个循环引用(实际上,不止一个)。这是我能提供的最清晰的例子:

class Baz:
    pass

print(Baz in Baz.__mro__)
#True
Run Code Online (Sandbox Code Playgroud)

Baz中还有其他一些循环引用__dict__,但您只需要一个即可。

我实际上没有任何解决方法可以为您提供 - 恐怕这就是 GC 的用途。如果您想进一步深入了解,我可以向您指出这个已经存在了一段时间的错误报告。