在未标记的文本语料库上训练 Spacy 以提取“重要短语”

Mur*_*iel 5 python nlp spacy

我正在寻找一种从文本文档中提取“重要短语”的方法。希望使用 Spacy 做到这一点,但有一个警告:我的数据主要包含产品信息,因此重要的短语与自然口语中的短语不同。出于这个原因,我想在我自己的语料库上训练 spacy,但我能找到的唯一信息是使用标记数据训练 spacy

有谁知道我想做的事情是否可行?