给定引理和标记,如何逆引理化过程?

Shi*_*Liu 7 python nlp nltk lemmatization

通常,在自然语言处理中,我们希望得到一个标记的引理。

例如,我们可以使用 wordnet lemmatization 将“eaten”映射到“eat”。

python中是否有任何工具可以将引理反转为某种形式?

例如,我们将 'go' 映射到 'gone' 给定目标形式 'eaten'。

PS:有人提到我们必须存储这样的映射。 如何在 Python 中取消词干?

pol*_*m23 6

将诸如引理之类的基本形式转换为适合情况的形式称为实现(或“表面实现”)。维基百科的例子:

NPPhraseSpec subject = nlgFactory.createNounPhrase("the", "woman");
subject.setPlural(true);
SPhraseSpec sentence = nlgFactory.createClause(subject, "smoke");
sentence.setFeature(Feature.NEGATED, true);
System.out.println(realiser.realiseSentence(sentence));
// output: "The women do not smoke."
Run Code Online (Sandbox Code Playgroud)

用于此的库不像词形还原器那样经常使用,这通常意味着您的选择较少,并且不太可能找到开发良好的库。维基百科的例子是用 Java编写的,因为支持它的最流行的库是SimpleNLG

快速搜索找到了pynlg,尽管它似乎没有得到积极维护。或者,您可以通过 Python 库nlgserv提供的 HTTP JSON 接口使用SimpleNLG