不,不是Apache Spark.我发现Sparkjava是最简单的API方法,也是我点击次数最多的方法,但是每个人都说它不应该用于制作,但没有人给我一个很好的答案.你们有没有人知道任何不稳定或安全漏洞或其他什么?
例如,我的想法是当我使用 doc2vec(s) 来训练模型时,它只是从数据集中构建词汇表。如果我想扩展它,我需要使用 build_vocab()
例如:
sentences = gensim.models.doc2vec.TaggedLineDocument(f_path)
dm_model = gensim.models.doc2vec.Doc2Vec(sentences, dm=1, size=300, window=8, min_count=5, workers=4)
dm_model.build_vocab()
Run Code Online (Sandbox Code Playgroud)