我可以创建带有预训练嵌入的 Apache Spark Word2VecModel 吗?

W.P*_*ill 5 apache-spark word2vec pyspark apache-spark-ml word-embedding

我想在我的 Python Spark 文本分类管道中使用词嵌入。该文档展示了如何训练您自己的嵌入,但我想使用像 GloVe 这样的预训练集。有没有某种方法可以使用预训练的嵌入来初始化 Word2VecModel 还是我必须编写自己的转换器类?