使用 gensim 加载 FastText 的法语预训练模型时出错

Cla*_*nen 5 python gensim french pre-trained-model fasttext

我正在尝试使用 FastText 的法语预训练二进制模型(从官方FastText 的 github 页面下载)。我需要.bin模型而不是.vec词向量,以便近似拼写错误和词汇外的词。

但是,当我尝试加载所述模型时,使用:

from gensim.models import FastText
model = FastText.load_fasttext_format('french_bin_model_path')
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

NotImplementedError: Supervised fastText models are not supported
Run Code Online (Sandbox Code Playgroud)

令人惊讶的是,当我尝试加载英文二进制模型时,它工作得很好

我正在运行 python 3.6 和 gensim 3.5.0。

欢迎任何关于为什么它不适用于法语矢量的想法!

efo*_*ont 5

我遇到了同样的问题,最终使用Facebook python 包装器来代替 gensim 的实现。

import fastText 
model = fastText.load(path_to_french_bin)
Run Code Online (Sandbox Code Playgroud)

然后,您可以获得词汇表外单词的词向量,如下所示:

oov_vector = model.get_word_vector(oov_word)

至于为什么 gensim 的load_fasttext_format作品适用于英国模型而不是法国模型,我不知道!