我在Wordnet中搜索大量单词的同义词.我这样做的方式,当某个单词有多个同义词时,结果按字母顺序返回.我需要的是按发生概率对它们进行排序,我只选择前1个同义词.
我使用prolog wordnet数据库和Syns2Index将其转换为Lucene类型索引以查询同义词.有没有办法以这种方式按照概率对它们进行排序,或者我应该使用另一种方法?
速度不重要,这个同义词查找不会在线完成.
万一有人偶然发现这个帖子,这就是要走的路(至少我需要的):
tagCount方法为每个单词提供最可能的synset组.问题再次是具有高概率的synset可以有几个单词.但我想没有机会避免这种情况
| 归档时间: |
|
| 查看次数: |
1921 次 |
| 最近记录: |