vkr*_*ris 11 apache hadoop machine-learning mahout
我试图解决一个简单的分类问题.
问题:
我有一组文本,我必须根据内容对它们进行分类.
使用Mahout的解决方案:
我知道我必须将输入转换为序列文件以生成模型.是的,我能够做到这一点.现在,我如何对测试数据进行分类?20News示例仅测试正确性.但是,我想做实际的分类.
我不确定是否需要编写代码或使用一些现有的类来对测试集进行分类.
我讨厌插入自己的工作,但我们在 Mahout in Action 中放入了有关分类的整个部分。理论、代码示例、案例研究实践,甚至整个服务器场实施。
您可以在http://www.manning.com/owen/获取预发行版本