输入单词是独立的,不是句子的一部分,但我想获取它所有可能的引理,就好像输入单词位于具有所有可能的 POS 标签的不同句子中一样。我还想获得该词引理的查找版本。
我为什么要这样做?
我从所有文档中提取了引理,并且还计算了引理之间的依赖链接的数量。这两件事我都使用过en_core_web_sm。现在,给定一个输入单词,我想返回与输入单词的所有可能引理最常链接的引理。
en_core_web_sm
简而言之,我想token._lemma用所有可能的 POS 标签复制输入单词的行为,以保持与我计算的引理链接的一致性。
token._lemma
python nlp lemmatization spacy spacy-3
lemmatization ×1
nlp ×1
python ×1
spacy ×1
spacy-3 ×1