使用XmlSlurper解析(非常)大型XML文件

Question

我是Groovy的新手,我正在尝试使用XmlSlurper读取一个(相当)大的XML文件(超过1Gb),因为它不构建整个DOM,所以它应该可以处理大文件的奇迹.在记忆中.

尽管如此,我仍然得到"OutOfMemoryError:Java堆空间",这让我觉得显然有些东西我做错了.我尝试增加Xmx设置,但我宁愿解决问题,因为我可能不得不处理更大的文件.

这是我使用的代码行:

def posts = new XmlSlurper().parse(new File("posts.xml"))

什么是错的暗示？

提前致谢,

热雷米.

Answer 1

Groovy XmlSlurper是一个SAX解析器,但将整个模型加载到内存中......

为了避免OOM异常,您可能需要提高内存容量(如您所说,使用-Xmx设置),或者您可以编写自己的SAX解析器以获取文档中所需的数据