fed*_*lov 7 weka mallet
哪种产品(Mallet或Weka)更适合文本分类任务:
我是这个问题的新手,所以任何评论都会很棒
Ala*_*air 4
MALLET 更容易使用,并且大部分工作都是隐形的。您也不必转换任何内容的格式,只需给它文本文件,它就会返回结果。
Weka 需要将文本转换为特定格式(Weka 脚本执行此操作非常缓慢且效率低下,因此我建议您编写自己的格式)。
MALLET 的问题在于,训练需要使用 GB 的内存,如果您有大型训练集,则可能需要几个小时。
Weka 有更多文档,但其中大部分没有意义。MALLET 的文档很少,但使用起来非常简单。
老实说,在测试了两者之后,我选择编写自己的分类器。
归档时间:
14 年,3 月 前
查看次数:
2478 次
最近记录:
13 年,5 月 前