tne*_*123 6 python swig struct
我遇到了一个有趣的发现,涉及SWIG如何处理包含其他结构作为成员的C结构的引用计数.
我发现在我将数据从结构子成员存储到其他python对象(列表/ dicts)的情况下使用它们之前,我的python SWIG对象正在收集垃圾.经过一段时间的挖掘后,我发现SWIG-ed结构成员似乎没有自己的独立引用计数,即使解释器表明它们是"Swig Objects".因此,当我将结构子元素中的数据添加到我的列表时,python不知道我已经添加了对此数据的引用.
我创建了一个简单的案例来演示.我SWIG-ed以下3个结构:
SWIG-ed C结构:
typedef struct
{
unsigned long source;
unsigned long destination;
} message_header;
typedef struct
{
unsigned long data[120];
} message_large_body;
typedef struct
{
message_header header;
message_large_body body;
} large_message;
Run Code Online (Sandbox Code Playgroud)
然后我创建了一个稍微等效的python类来比较纯SWIG-ed解决方案的行为.
有点等效的Python类
class pyLargeMessage(object):
def __init__(self):
self.header = bar.message_header()
self.body = bar.message_large_body()
Run Code Online (Sandbox Code Playgroud)
然后我在解释器中运行了以下测试.
Python解释器结果
>>> y = pyLargeMessage()
>>> y
<__main__.pyLargeMessage object at 0x06C5E6B0>
>>> y.header
<Swig Object of type 'message_header *' at 0x06C5E700>
>>> sys.getrefcount(y.header)
3
>>> z = [y.header]
>>> sys.getrefcount(y.header)
3
>>> z += [y.header]
>>> sys.getrefcount(y.header)
4
>>>
>>> y = bar.large_message()
>>> y
<Swig Object of type 'large_message *' at 0x06C668E0>
>>> y.header
<Swig Object of type 'message_header *' at 0x06C66B60>
>>> sys.getrefcount(y.header)
1
>>> z = [y.header]
>>> sys.getrefcount(y.header)
1
>>> z += [y.header]
>>> sys.getrefcount(y.header)
1
>>>
Run Code Online (Sandbox Code Playgroud)
Python实现的行为符合我的预期,但纯SWIG实现却没有.有人能解释一下这里发生了什么吗?
我已多次阅读SWIG文档的各个部分,但找不到任何直接解释这一点的内容.我已经学到了很多关于事情如何运作的知识,但我找不到上述现象的任何明确的解释/解决方法.
在考虑了很长一段时间之后,一遍又一遍地重新阅读结构和类,代理类和结构数据成员部分并查看生成的包装器代码,我仍然无法弄清楚为什么引用计数没有正常处理.
生成的C代码调用SWIG_NewPointerObj
,最终(在大多数情况下)调用PyObject_New
,而这应该(如python文档所述)返回一个新的引用.
生成标题成员的get-er的SWIG代码
SWIGINTERN PyObject *_wrap_large_message_header_get(PyObject *self, PyObject *args) {
PyObject *resultobj = 0;
large_message *arg1 = (large_message *) 0 ;
void *argp1 = 0 ;
int res1 = 0 ;
message_header *result = 0 ;
if (args && PyTuple_Check(args) && PyTuple_GET_SIZE(args) > 0) SWIG_fail;
res1 = SWIG_ConvertPtr(self, &argp1,SWIGTYPE_p_large_message, 0 | 0 );
if (!SWIG_IsOK(res1)) {
SWIG_exception_fail(SWIG_ArgError(res1), "in method '" "large_message_header_get" "', argument " "1"" of type '" "large_message *""'");
}
arg1 = (large_message *)(argp1);
result = (message_header *)& ((arg1)->header);
resultobj = SWIG_NewPointerObj(SWIG_as_voidptr(result), SWIGTYPE_p_message_header, 0 | 0 );
return resultobj;
fail:
return NULL;
}
Run Code Online (Sandbox Code Playgroud)
header
正如已经指出的那样, and的 getter 返回的对象body
基本上是一个轻量级代理对象,它保存着指向header
/body
内部的内存的指针struct
。它不拥有该内存(它仍然由message
对象本身或 C 库“拥有”,具体取决于您创建它的方式)并且它不是副本。
即使它是一个副本,您对 getter 的调用sys.getrefcount
也始终会返回 1 - 每次调用 getter 都会返回一个新副本。
从Python的角度来看,如果你想确保永远不会有悬空指针,有两种方法可以修复它:
header
getter 返回/副本的代理,body
该副本拥有它所指向的内存。message
,因此即使被message
释放,它的引用计数也不会达到 0,同时有代理对象引用它的一部分。我整理了一个使用 SWIG 执行#2 的示例。你的头文件保持不变,但接口变成:
%module test
%{
#include "test.h"
%}
%typemap(out) message_header * header %{
// This expands to resultobj = SWIG_NewPointerObj(...) exactly as before:
$result = SWIG_NewPointerObj(SWIG_as_voidptr($1), $1_descriptor, 0);
// This sets a reference to the parent object inside the child
PyObject_SetAttrString($result, "_parent", obj0);
%}
%include "test.h"
Run Code Online (Sandbox Code Playgroud)
这相当于说:
z = y.header
z._parent = y
Run Code Online (Sandbox Code Playgroud)
在Python中。
有了这个,我们现在可以运行:
y = test.large_message()
print(sys.getrefcount(y))
print(y.header)
z = [y.header]
print(sys.getrefcount(y))
z += [y.header]
print(sys.getrefcount(y))
Run Code Online (Sandbox Code Playgroud)
y
正如预期的那样,它显示了随着创建的每个子对象代理而增加的引用计数。因此,它们引用的内存不能被过早地释放(至少不能被 SWIG 释放)。
您可以使用以下命令使其更加通用并将其应用于多种类型/成员%apply
:
%module test
%{
#include "test.h"
%}
%typemap(out) SWIGTYPE * SUBOBJECT %{
$result = SWIG_NewPointerObj(SWIG_as_voidptr($1), $1_descriptor, 0);
PyObject_SetAttrString($result, "_parent", obj0);
assert(obj0);
// hello world
%}
%apply SWIGTYPE * SUBOBJECT { message_header * header };
%apply SWIGTYPE * SUBOBJECT { message_large_body * body };
%include "test.h"
Run Code Online (Sandbox Code Playgroud)