使用clang/llvm的C++精确垃圾收集器?

use*_*168 5 c++ garbage-collection clang

好的,我想用C++编写一个精确的'标记和扫描'垃圾收集器.我希望做出一些可以帮助我的决定,因为我的所有指针都将包含在'RelocObject'中,并且我将为堆提供一个单独的内存块.这看起来像这样:

// This class acts as an indirection to the actual object in memory so that it can be      
// relocated in the sweep phase of garbage collector
class MemBlock
{
public:
    void* Get( void ) { return m_ptr; }

private:
    MemBlock( void ) : m_ptr( NULL ){}

    void* m_ptr;
};

// This is of the same size as the above class and is directly cast to it, but is     
// typed so that we can easily debug the underlying object
template<typename _Type_>
class TypedBlock
{
public:
    _Type_* Get( void ) { return m_pObject; }

private:
    TypedBlock( void ) : m_pObject( NULL ){}

    // Pointer to actual object in memory
    _Type_* m_pObject;
};

// This is our wrapper class that every pointer is wrapped in 
template< typename _Type_ >
class RelocObject
{
public:

    RelocObject( void ) : m_pRef( NULL ) {}

    static RelocObject New( void )
    {
        RelocObject ref( (TypedBlock<_Type_>*)Allocator()->Alloc( this, sizeof(_Type_), __alignof(_Type_) ) );
        new ( ref.m_pRef->Get() ) _Type_();
        return ref;
    }

    ~RelocObject(){}

    _Type_*     operator->  ( void ) const 
    { 
        assert( m_pRef && "ERROR! Object is null\n" ); 
        return (_Type_*)m_pRef->Get(); 
    }

    // Equality
    bool operator ==(const RelocObject& rhs) const { return m_pRef->Get() == rhs.m_pRef->Get(); }
    bool operator !=(const RelocObject& rhs) const { return m_pRef->Get() != rhs.m_pRef->Get(); }

    RelocObject&    operator=   ( const RelocObject& rhs ) 
    {
        if(this == &rhs) return *this;
        m_pRef = rhs.m_pRef;
        return *this; 
    }

private:

    RelocObject( TypedBlock<_Type_>* pRef ) : m_pRef( pRef ) 
    {
        assert( m_pRef && "ERROR! Can't construct a null object\n");
    }

    RelocObject*    operator&   ( void ) { return this; }
    _Type_&     operator*   ( void ) const { return *(_Type_*)m_pRef->Get(); }

    // SS: 
    TypedBlock<_Type_>* m_pRef;
};

// We would use it like so...
typedef RelocObject<Impl::Foo> Foo;

void main( void )
{
    Foo foo = Foo::New();
}
Run Code Online (Sandbox Code Playgroud)

因此,为了找到"根" RelocObjects,当我在"RelocObject ::新"分配我通过在RelocObject的"这个"指针到分配器(垃圾收集器).然后,分配器检查"this"指针是否在堆的内存块范围内,如果是,那么我可以假设它不是根.

因此,当我想使用位于每个子对象内的零个或多个RelocObjects从子对象跟踪子对象时,问题就出现了.

我想使用'精确'方法在类(即子对象)中找到RelocObjects.我可以使用反射方法并使用户在每个类中注册他或她的RelocObjects.然而,这将非常容易出错,因此我想自动执行此操作.

因此,我希望在编译时使用Clang在类中找到RelocObjects的偏移量,然后在程序启动时加载此信息,并在垃圾收集器的标记阶段使用它来跟踪并标记子对象.

所以我的问题是Clang能帮忙吗?我听说你可以使用编译时钩子在编译期间收集各种类型的信息.如果是这样,我应该在Clang中寻找什么,即有没有做这种事情的例子?

只是为了明确:我想使用Clang在FooB中自动找到'Foo'的偏移量(这是RelocObject的typedef)而用户没有提供任何"提示",即他们只是写:

class FooB
{
public:
    int m_a;
    Foo m_ptr;
};
Run Code Online (Sandbox Code Playgroud)

在此先感谢您的帮助.

Kel*_*yne 1

每当 aRelocObject被实例化时,它的地址就可以记录在RelocObject所有权数据库中,并且sizeof(*derivedRelocObject)可以立即识别哪个Foo属于哪个FooB。你不需要 Clang。此外,由于Foo将在之后不久创建FooB,因此您的所有权数据库系统可以非常简单,因为“我已创建,这是我的地址和大小”调用的顺序将RelocObject直接在RelocObject其拥有的实例

每个对象RelocObject都有一个ownership_been_declared在首次使用时初始化为 false 的标志(这将在构造函数完成之后,因为构造函数中不应执行任何实际工作),因此当首次使用这些新创建的对象中的任何一个时,它会请求数据库更新它是所有权,数据库会遍历它的记录地址队列,并可以识别哪些对象属于哪个对象,从列表中清除一些对象,将它们的ownership_been_declared标志设置为 true,您也将获得偏移量(如果您仍然需要它们)。


ps,如果您愿意,我可以分享我多年前编写的增量垃圾收集器的代码,您可能会发现它很有帮助。