spark word2vec窗口大小

jam*_*smf 3 machine-learning apache-spark word2vec

无论如何要改变使用的窗口大小pyspark.mllib.feature.Word2Vec或永久固定为5?这似乎是一个相当重要的特征.

我在这里看不到这个选项:https: //spark.apache.org/docs/1.4.1/api/scala/index.html#org.apache.spark.mllib.feature.Word2Vec

Hol*_*den 6

多数民众赞成正确,看看Word2Vec代码,我们可以看到它是一个私有的val.如果你想,你可以覆盖Word2Vec来改变窗口大小.我已经创建了一个JIRA(https://issues.apache.org/jira/browse/SPARK-10299)以允许设置窗口大小,因为1.5已经处于RC阶段,这可能无法实现直到1.6时.