名词在WordNet中的同义词

fla*_*cto 4 synonym wordnet elasticsearch

我想synonym在Elasticsearch中使用tokenfilter作为索引.我下载了Prolog版本的WordNet 3.0,并找到了wn_s.plElasticsearch可以理解的文件.但是,似乎该文件包含各种单词和短语的同义词,而我真的只对支持名词的同义词感兴趣.有没有办法提取这些类型的条目?

art*_*omp 8

鉴于格式wn_s.pl

s(112947045,1,'usance',n,1,0).
s(200001742,1,'breathe',v,1,25).
Run Code Online (Sandbox Code Playgroud)

这样做的一种非常原始的方法是在终端中执行以下操作,只从该文件中获取具有',n'字符串的行.

grep ",n," wn_s.pl > wn_s_nouns_only.pl
Run Code Online (Sandbox Code Playgroud)

该文件wn_s_nouns_only.pl只有标记为名词的条目.

  • 哦耶!我怎么没想到这个.谢谢!您也可以将`grep',n,"wn_s.pl> wn_s_nounsOnly.pl`作为稍短的版本. (2认同)