小编cod*_*ber的帖子

为什么Sparkjava不适合生产?

不,不是Apache Spark.我发现Sparkjava是最简单的API方法,也是我点击次数最多的方法,但是每个人都说它不应该用于制作,但没有人给我一个很好的答案.你们有没有人知道任何不稳定或安全漏洞或其他什么?

java production libraries spark-java

8
推荐指数
2
解决办法
6095
查看次数

如何在gensim中使用build_vocab?

  1. Build_vocab 扩展我的旧词汇?

例如,我的想法是当我使用 doc2vec(s) 来训练模型时,它只是从数据集中构建词汇表。如果我想扩展它,我需要使用 build_vocab()

  1. 我应该在哪里使用它?我应该把它放在“gensim.doc2vec()”之后吗?

例如:

sentences = gensim.models.doc2vec.TaggedLineDocument(f_path)
dm_model = gensim.models.doc2vec.Doc2Vec(sentences, dm=1, size=300, window=8, min_count=5, workers=4)
dm_model.build_vocab()
Run Code Online (Sandbox Code Playgroud)

nlp gensim word2vec doc2vec

3
推荐指数
1
解决办法
7573
查看次数

标签 统计

doc2vec ×1

gensim ×1

java ×1

libraries ×1

nlp ×1

production ×1

spark-java ×1

word2vec ×1