Mallet vs Weka用于文本分类

fed*_*lov 7 weka mallet

哪种产品(Mallet或Weka)更适合文本分类任务:

  1. 更容易训练
  2. 效果更好
  3. 文档

我是这个问题的新手,所以任何评论都会很棒

Ala*_*air 4

MALLET 更容易使用,并且大部分工作都是隐形的。您也不必转换任何内容的格式,只需给它文本文件,它就会返回结果。

Weka 需要将文本转换为特定格式(Weka 脚本执行此操作非常缓慢且效率低下,因此我建议您编写自己的格式)。

MALLET 的问题在于,训练需要使用 GB 的内存,如果您有大型训练集,则可能需要几个小时。

Weka 有更多文档,但其中大部分没有意义。MALLET 的文档很少,但使用起来非常简单。

老实说,在测试了两者之后,我选择编写自己的分类器。