使用 python NLTK 创建自己的同义词/同义词库/同义词集的最佳方法是什么?例如 - 在金融领域:
US
synonyms: United States, Washington,
hyponyms: Wall Street
meronym: dollar
Run Code Online (Sandbox Code Playgroud)
ETC。
简单地创建一个类似于 wordnet 但更适合我的目的的同义词集。
我计划开始手动创建它,然后在我清楚创建步骤后实施一种算法来完成它。
但首先我需要了解这样一个语料库的原理。查看 Wordnet 语料库中的文件,我找到以下文件列表:
adj.exc citation.bib data.adj data.noun index.adj index.noun index.verb LICENSE README
adv.exc cntlist.rev data.adv data.verb index.adv index.sense lexnames noun.exc verb.exc
Run Code Online (Sandbox Code Playgroud)
这些文件的内容相当晦涩,对于理解它的工作原理确实没有帮助。所有见解均受到赞赏。谢谢