在垃圾收集时,NodeJS中的内容会损坏ref-struct

Hun*_*ter 4 garbage-collection ref node.js ref-struct

ref-struct实例嵌套在另一个实例中,嵌套对象的其中一个属性在手动垃圾回收时会损坏.

请参阅此最小代码复制:https://github.com/hunterlester/minimum-ref-struct-corruption

请注意日志输出的第3行,其值name未损坏:

Running garbage collection...
authGranted object afte gc:  { name: '?_n9a\u0002', 'ref.buffer': <Buffer@0x00000261396F3910 18 86 6c 39 61 02 00 00> }
Unnested access container entry after gc:  { name: 'apps/net.maidsafe.examples.mailtutorial', 'ref.buffer': <Buffer@0x00000261396F3B10 60 68 6e 39 61 02 00 00> }
Globally assigned values after gc:  apps/net.maidsafe.examples.mailtutorial  _publicNames
Run Code Online (Sandbox Code Playgroud)

vse*_*nko 5

虽然ref,ref-struct以及ref-array功能强大,但脆弱的东西,他们的组合可以表现真的不清楚.

您的样本有两个细微差别:

  1. 调用makeAccessContainerEntry两次会覆盖您的全局缓存 - 在调用期间CStrings 缓存(global.x0global.x1)makeAuthGrantedFfiStruct将被第二次直接makeAccessContainerEntry调用覆盖.

  2. 看来你也应该缓存每一个ContainerInfoArray.

此代码应该可以正常工作:

const ArrayType = require('ref-array');
const ref = require('ref');
const Struct = require('ref-struct');
const CString = ref.types.CString;

const ContainerInfo = Struct({
  name: CString
});

const ContainerInfoArray = new ArrayType(ContainerInfo);

const AccessContainerEntry = Struct({
  containers: ref.refType(ContainerInfo)
});

const AuthGranted = Struct({
  access_container_entry: AccessContainerEntry
});

const accessContainerEntry = [
  {
    "name": "apps/net.maidsafe.examples.mailtutorial",
  },
  {
    "name": "_publicNames",
  }
];

const makeAccessContainerEntry = (accessContainerEntry) => {
  const accessContainerEntryCache = {
    containerInfoArrayCache: null,
    containerInfoCaches: [],
  };
  accessContainerEntryCache.containerInfoArrayCache = new ContainerInfoArray(accessContainerEntry.map((entry, index) => {
    const name = ref.allocCString(entry.name);
    accessContainerEntryCache.containerInfoCaches.push(name);
    return new ContainerInfo({ name });
  }));
  return {
    accessContainerEntry: new AccessContainerEntry({
      containers: accessContainerEntryCache.containerInfoArrayCache.buffer,
    }),
    accessContainerEntryCache,
  };
};

const makeAuthGrantedFfiStruct = () => {
  const ace = makeAccessContainerEntry(accessContainerEntry);
  return {
    authGranted: new AuthGranted({
      access_container_entry: ace.accessContainerEntry,
    }),
    authGrantedCache: ace.accessContainerEntryCache,
  };
}

const authGranted = makeAuthGrantedFfiStruct();
const unNestedContainerEntry = makeAccessContainerEntry(accessContainerEntry);

if(global.gc) {
  console.log('Running garbage collection...');
  global.gc();
}

console.log('authGranted object afte gc: ', authGranted.authGranted.access_container_entry.containers.deref());
console.log('Unnested access container entry after gc: ', unNestedContainerEntry.accessContainerEntry.containers.deref());
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,我将缓存添加到makeAccessContainerEntry输出中,只要您需要从垃圾收集中保存数据,就应该将其保留在某个位置.

编辑:一些背景

JS实现了高级内存管理,其中对象由引用引用,只要没有对特定对象的引用,就会释放内存.

在C中没有引用和GC,但有些指针只是指向特定结构或内存块所在位置的内存地址.

ref使用以下技术绑定这两个:C指针是一个缓冲区,它存储实际数据在内存中的内存地址.实际数据通常也表示为缓冲区.

ref-struct是一个插件,ref它实现了将底层内存块(缓冲区)解释为结构的能力 - 用户定义类型及它们在内存中的位置,ref-struct尝试读取内存块的相应部分并获取值.

ref-array是一个插件,ref它实现了将底层内存块(缓冲区)解释为数组的能力 - 用户定义类型及它们在内存中的位置,ref-array尝试读取内存块的相应部分并获取数组项.

这样,如果你为某个东西分配了一个Buffer,那么就获得一个ref对它的引用(一个新的Buffer,它只保存原始Buffer的内存地址)并丢失对原始Buffer的JS引用,然后原始的Buffer可以被GC释放像这样:

function allocateData() {
  const someData = Buffer.from('sometext');
  return ref.ref(data);
}

const refReference = allocateData();
// There are no more direct JS references to someData - they are all left in the scope of allocateData() function.

console.log(refReference.deref());
global.gc(); // As long as there are no more JS references to someData, GC will release it and use its memory for something else.
console.log(refReference.deref());
Run Code Online (Sandbox Code Playgroud)

还不赶快来测试该代码-无论是console.log(refReference.deref());将打印相同的输出,因为ref拥有一个隐藏的参考引用datarefReference.

ref-struct并且ref-array知道这种情况并且通常也正确地保持对引用数据的隐藏引用.但是,组合ref-structref-array揭示错误或潜在的不兼容性和隐藏的引用有时会丢失.解决方法是自己缓存引用 - 这是我建议使用的方法.

  • @HunterLester,我补充了一些背景知识. (2认同)