如何加载从 StarSpace 生成的嵌入(在 tsv 文件中)

Jus*_*ata 7 gensim word-embedding

有谁知道如何将带有从 StarSpace 生成的嵌入的 tsv 文件加载到 Gensim 中?Gensim 文档似乎经常使用 Word2Vec,但我找不到相关的答案。

谢谢,

阿穆利亚

Mar*_*arc 1

我无法使用 Gensim 直接加载 StarSpace 嵌入文件。

但是,我能够使用embed_docStarSpace 提供的实用程序将我的单词/句子转换为其矢量表示形式。您可以在此处阅读有关该实用程序的更多信息。

这是我用于转换的命令:

$ ./embed_doc model train.txt > vectors.txt

这会将线从 转换train.txt为向量并将输出通过管道传输到vectors.txt。遗憾的是,这包括命令本身的输出和输入行。

最后,为了将向量加载到 Python 中,我使用了以下代码(抱歉,它可能不是很Pythonic和干净)。

file = open('vectors.txt')
X = []

for i, line in enumerate(file):
    should_continue = i < 4 or i % 2 != 0

    if should_continue:
        continue

    vector = [float(chunk) for chunk in line.split()]

    X.append(vector)
Run Code Online (Sandbox Code Playgroud)