fla*_*cto 4 synonym wordnet elasticsearch
我想synonym
在Elasticsearch中使用tokenfilter作为索引.我下载了Prolog版本的WordNet 3.0,并找到了wn_s.pl
Elasticsearch可以理解的文件.但是,似乎该文件包含各种单词和短语的同义词,而我真的只对支持名词的同义词感兴趣.有没有办法提取这些类型的条目?
鉴于格式wn_s.pl
是
s(112947045,1,'usance',n,1,0).
s(200001742,1,'breathe',v,1,25).
Run Code Online (Sandbox Code Playgroud)
这样做的一种非常原始的方法是在终端中执行以下操作,只从该文件中获取具有',n'字符串的行.
grep ",n," wn_s.pl > wn_s_nouns_only.pl
Run Code Online (Sandbox Code Playgroud)
该文件wn_s_nouns_only.pl
只有标记为名词的条目.
归档时间: |
|
查看次数: |
1357 次 |
最近记录: |