如何使用GermaNet(WordNet德国通讯员)与R

ale*_*lex 6 r wordnet lemmatization

我想使用GermaNet进行词典化(对应getLemma()于WordNet),列表(实际上是DTM术语 - 用于增强文本分类性能).但是,我找不到GermaNet的任何提示或R包.是否有可能仍然在R中使用它?

use*_*004 1

我假设您可以访问存储 wordnet 数据的原始文件(Germanet 似乎允许免费许可)。您可以解析它们(只需使用一些漂亮的正则表达式)并提取您需要的信息(我不知道 DTM 到底是什么,但我认为它与同义词集或之间的链接有关)。我工作的一个 wordnet(不是德语)被组织在多个文件中,一些包含链接,一些信息的形式如下

0 @1@ WORD_MEANING
  1 PART_OF_SPEECH "v"
  1 VARIANTS
    2 LITERAL "someverb"
      3 SENSE 7
      3 DEFINITION "adefinition"
      3 EXAMPLES
        4 EXAMPLE "anexample"
      3 EXTERNAL_INFO
...
Run Code Online (Sandbox Code Playgroud)

这应该不难解析。