导入大型数据集时的核心数据内存使用情况

Rob*_*jke 8 memory core-data ios

我现在因为讨厌的核心数据问题而陷入困境大约两周.我阅读了很多博客文章,文章和SO问题/答案,但我仍然无法解决我的问题.

我运行了很多测试,并且能够将更大的问题减少到更小的问题.这将是一个很大的解释,所以请跟我一起!

问题 - 数据模型

我必须得到以下datamodel:

对象A与对象B具有一对多的关系,它与对象C具有另一个一对多的关系.由于核心数据的建议,我必须创建反向关系,因此B的每个实例都指向其父A和相同的C指向其父B.

A <->> B <->> C
Run Code Online (Sandbox Code Playgroud)

问题 - MOC设置

为了保持响应顺畅,我创建了一个三级的managedObjectContext结构.

  1. 父MOC - 使用自己的私有线程运行NSPrivateQueueConcurrencyType,是紧的persistentStoreCoordinator
  2. MainQueue MOC - 在mainThread上运行NSMainQueueConcurrencyType并拥有父MOC 1
  3. 对于每个解析操作,我创建第三个MOC,它也有其私有队列并具有父mainQueue MOC

我的主数据控制器作为观察者被添加到NSManagedObjectContextDidSaveMOC 2 的通知中,因此每次MOC 2保存时performBlock:,MOC1被触发,执行保存操作(由于异步performBlock:).

问题 - 解析

为了将大型JSON文件解析为我的Core Data结构,我编写了一个循环解析器.该解析器首先创建一个新的MOC(3).然后它获取对象A的数据并解析其属性.然后解析器读出B的JSON关系并创建填充数据的相应对象.通过调用addBObject:A 将这些新对象添加到A.因为解析器是循环的,解析B意味着解析C,这里也创建新对象并附加到B.这一切都发生在performBlock:MOC 3上.

  • 解析(创建'A'对象并开始解析B)
    • 解析A(创建'B'对象,将它们附加到A并开始解析C)
      • 解析B(创建'C'对象,将它们附加到B)
        • 解析C(只将数据存储在C对象中)

在每次解析操作之后,我保存MOC 3并在mainThread上调度主MOC(2)的保存操作.由于NSManagedObjectContextDidSave通知MOC 1将异步自动保存.

        if (parsed){
            NSError *error = nil;
            if (![managedObjectContext save:&error])
                NSLog(@"Error while saving parsed data: %@", error);
        }else{
            // something went wrong, discard changes
            [managedObjectContext reset];
        }

        dispatch_async(dispatch_get_main_queue(), ^{                
            // save mainQueueManagedObjectContext
            [[HWOverallDataController sharedOverallDataController] saveMainThreadManagedObjectContext];
        });
Run Code Online (Sandbox Code Playgroud)

要释放我的内存占用,因为我现在不需要解析数据,我正在执行:

[a.managedObjectContext refreshObject:a mergeChanges:NO];
Run Code Online (Sandbox Code Playgroud)

对于刚刚解析的每个AI.

因为我需要解析大约10个A,它们都有大约10个B,它们都有大约10个C,所以生成了很多的managedObject.

问题 - 仪器

一切正常.唯一的事情是:当我打开分配工具时,我看到未发布的A,B和C.我没有从他们的retainCounts或任何内容中获得任何有用的信息.并且因为我的实际问题涉及更复杂的dataModel,所以生物对象成为严重的内存问题.有人能弄清楚我做错了什么吗?使用正确的managedObject在其他managedObjectContexts上调用refreshObjects也不起作用.只有一个硬盘reset似乎工作,但后来我松开了指向UI使用的生活对象的指针.

其他解决方案我试过

  • 我尝试创建单向关系而不是双向关系.这会产生许多其他问题,导致核心数据不一致和奇怪的行为(例如悬空对象和核心数据生成1-n关系而不是nn关系(因为反向关系未知).

  • 当我NSManagedObjectContextDidSave在任何对象上检索通知时,我尝试刷新每个已更改或插入的对象

这两种"解决方案"(顺便说一句都不起作用)似乎也有些笨拙.这不应该是要走的路.应该有一种方法可以在不增加内存占用和保持UI流畅的情况下实现这一点吗?

- CodeDemo

http://cl.ly/133p073h2I0j

- 进一步的调查

在mainContext(在mainSave之后)刷新每个使用过的对象(这是繁琐的工作)后,对象的大小减少到48个字节.这表示对象都是故障,但内存中仍有一个指针.当我们有大约40.000个对象都出现故障时,内存中仍有1.920 MB,在重置persistentManagedObjectContext之前永远不会释放.这是我们不想做的事情,因为我们放弃了对任何managedObject的每个引用.

ado*_*oho 5

罗宾,

我有一个类似的问题,我解决的不同于你.在您的情况下,您有第三个IMO冗余MOC,即父MOC.就我而言,我让两个MOC以旧学校的方式通过DidSave通知通过持久性商店协调员进行通信.新的面向块的API使这更加简单和健壮.这让我可以重置子MOC.虽然您从第三个MOC获得了性能优势,但它与我利用的SQLite行缓存相比并没有那么大的优势.你的路径消耗更多的内存.最后,我可以通过跟踪DidSave通知来修剪项目.

顺便说一句,你也可能正在大大增加你MALLOC_TINYMALLOC_SMALLVM区域的大小.我的尾随修剪算法让分配器可以更快地重用空间,从而延缓这些有问题区域的增长.根据我的经验,这些地区由于其庞大的居民记忆足迹而成为我的应用程序Retweever被杀害的主要原因.我怀疑你的应用程序遭受同样的命运.

当内存警告到来时,我打电话给下面的片段:

[self.backgroundMOC performBlock: ^{ [self.backgroundMOC reset]; }];

[self.moc save];

[self.moc.registeredObjects trimObjects];
Run Code Online (Sandbox Code Playgroud)

-[NSArray(DDGArray) trimObjects] 只需通过一个数组并刷新对象,从而修剪它们.

总之,Core Data似乎为许多MOC中出现的项目实现了写入算法的副本.因此,你会以意想不到的方式保留东西.我专注于在导入后断开这些连接以最小化我的内存占用.由于SQLite行缓存,我的系统似乎可以很好地执行.

安德鲁