相关疑难解决方法(0)

我已经在非常短的句子（最多 10 个单词）的语料库上使用 Gensim 训练了 fasttext 模型。我知道我的测试集包括不在我的训练语料库中的词，即我的语料库中的一些词像“催产素”、“Lexitocin”、“Ematrophin”、“Betaxitocin”

给定测试集中的一个新词，fasttext 非常清楚地知道通过使用字符级别 n-gram 生成一个与训练集中其他相似词具有高余弦相似度的向量

如何将 fasttext 模型合并到 LSTM keras 网络中，而不会丢失 fasttext 模型到词汇表中的向量列表？因为那样的话，即使 fasttext 做得很好，我也不会处理任何 OOV。

任何的想法？

4
推荐指数

1
解决办法

1930
查看次数

nlp ×1