如何在Windows环境中使用Mahout?

use*_*210 5 windows cygwin hadoop mahout

我试图在Windows上运行的应用程序中使用Mahout.我想使用k-means从lucene索引构建集群.

一旦我必须创建序列文件(从lucene索引创建向量),我就会得到一个Hadoop-Exception,因为Hadoop会对Windows环境中未知的程序(例如chmod)进行命令行调用.在Cygwin中运行不是一个选项,因为我希望能够从eclipse运行应用程序.

所以我的问题是

  • 有没有办法避免必须创建序列文件从lucene索引中检索我的向量?
  • 或者有没有办法在Windows环境中创建序列文件?
  • baj*_*ife 4

    在 Windows 环境中运行 Hadoop 的唯一方法是安装 Cygwin。有关更多信息,请参阅此博客文章:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin 将提供 Hadoop 依赖的所有命令行实用程序(如 chmod)。如果需要,您仍然可以从 Eclipse 中运行 Hadoop 作业。