Jus*_*ata 7 gensim word-embedding
有谁知道如何将带有从 StarSpace 生成的嵌入的 tsv 文件加载到 Gensim 中?Gensim 文档似乎经常使用 Word2Vec,但我找不到相关的答案。
谢谢,
阿穆利亚
我无法使用 Gensim 直接加载 StarSpace 嵌入文件。
但是,我能够使用embed_docStarSpace 提供的实用程序将我的单词/句子转换为其矢量表示形式。您可以在此处阅读有关该实用程序的更多信息。
这是我用于转换的命令:
$ ./embed_doc model train.txt > vectors.txt
这会将线从 转换train.txt为向量并将输出通过管道传输到vectors.txt。遗憾的是,这包括命令本身的输出和输入行。
最后,为了将向量加载到 Python 中,我使用了以下代码(抱歉,它可能不是很Pythonic和干净)。
file = open('vectors.txt')
X = []
for i, line in enumerate(file):
should_continue = i < 4 or i % 2 != 0
if should_continue:
continue
vector = [float(chunk) for chunk in line.split()]
X.append(vector)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2683 次 |
| 最近记录: |