我应该如何(智能地)存储和存档大型xml文件以进行数据导入

gsi*_*ner 2 xml postgresql ruby-on-rails mongodb

我们有一个rails应用程序可以处理大量的xml数据导入.现在我们在Postgres中存储这些~5MB xml的文档.鉴于我们使用每个xml doc一次或两次进行解析,这并不理想.我们希望有一种智能的方式来存储和存档这些文档,但不要为了空间而过度复杂化检索过程.我们已经考虑过将文档移到Mongo(我们也在使用),但是我们不是只是人为地提高Mongo数据库服务器的内存需求吗?

我们处理这个问题的最佳方式是什么?

Tom*_*ine 5

您可以尝试使用XML数据库eXist.但是,如果您只是归档它们,为什么不将它们存储在目录树中呢?


mor*_*itz 5

如果你只使用它解析一次或两次然后从给定的链接加载文件,我只会在数据库中存储一个文件的链接.另一个方法是使用XML DB,例如eXist.