from spacy.en import English
from numpy import dot
from numpy.linalg import norm
parser = English()
# you can access known words from the parser's vocabulary
nasa = parser.vocab['NASA']
# cosine similarity
cosine = lambda v1, v2: dot(v1, v2) / (norm(v1) * norm(v2))
# gather all known words, take only the lowercased versions
allWords = list({w for w in parser.vocab if w.has_repvec and w.orth_.islower() and w.lower_ != "nasa"})
# sort by similarity to NASA
allWords.sort(key=lambda w: cosine(w.repvec, nasa.repvec))
allWords.reverse()
print("Top 10 …Run Code Online (Sandbox Code Playgroud) 我正在尝试将最新的 Spark api 与 SparkSession 一起使用。
当我导入包时,我的 Eclipse 在附件中显示错误。
我正在使用 2.10.6 scala 编译器。
请帮我解决这个问题。
