我一直在使用mallet来推断包含100,000行(大约34 MB的mallet格式)的文本文件的主题.但是现在我需要在包含一百万行(大约180MB)的文件上运行它,并且我得到一个java.lang.outofmemory异常.有没有办法将文件拆分成较小的文件并为所有文件中存在的数据构建模型?提前致谢
java nlp machine-learning mallet
java ×1
machine-learning ×1
mallet ×1
nlp ×1