斯坦福CoreNLP用于获取解析树的更快的替代方案?

Alp*_*aaa 3 java nlp stanford-nlp

我喜欢Stanford CoreNLP,现在它对我的NLP需求非常准确.问题在于分析大量文本(假设数百万句话)需要数天时间.

是否存在牺牲一些准确性以提高效率的替代Java实现(理想情况下)提供相同的API?

rec*_*rec 5

如果您使用的是PCFG或因子模型,您可以考虑切换到自3.2版以来可用的新RNN模型 - 它们要快得多.

或者,如果您只需要依赖项,则可以尝试其他解析器(例如,mate-tools解析器ClearNLP依赖项解析器).如果你需要成分,你可以尝试Berkeley解析器.

Afaik,没有其他解析器实现与Stanford Parser具有相同的API.但是,有些集合为不同的解析器提供了相当统一的API,例如DKPro CoreClearTK.

披露:我是DKPro Core项目的开发人员.