WordNet有"级别"吗?(NLP)

TIM*_*MEX 6 python text nlp words wordnet

例如...

鸡是动物.
墨西哥卷饼是一种食物.

WordNet允许您执行"is-a"......层次结构功能.

但是,我怎么知道何时停止在树上旅行?我想要一个级别.
这是一致的.

例如,如果出现一堆单词,我希望wordNet对所有单词进行分类,但在某个级别,所以它不会太过分.将"墨西哥卷饼"归类为"东西"过于宽泛,但"墨西哥包裹食物"过于具体.我想上升到原始状态或向下......直到正确的水平.

Pet*_*ham 13

WordNet是一个词典而不是本体,因此"级别"并不真正适用.

SUMO,这是一个上层本体,如果你想定向格,而不是一个网络,它涉及到共发现.

对于某些领域,SUMO的中级本体可能是你想看的地方,但我不确定它是否有"墨西哥包装食品",因为它的大部分主题都是科学或工程.

WordNet的层次结构是

beef burrito < burrito < dish/2 < victuals < food < substance < entity. 
Run Code Online (Sandbox Code Playgroud)

实体是一个顶级的概念,所以如果你停止下面的物质你会得到卷饼是一种食物.您可以基于此计算级别,但它不一定与SUMO一致,或者生成您自己的一组有用的中级概念以终止.WordNet中没有"墨西哥包裹食物"的步骤.


mjv*_*mjv 6

[ 请相信Pete Kirkham,他首先提到了SUMO,这可能很好地回答了Alex,OP提出的问题]

(我只是在这里提供一系列信息;我开始在评论领域,但很快用完了空间和布局功能......)

Alex:SUMO的大部分是科学还是工程?它不包含食品,人,汽车,工作等每天的单词?
Pete K:SUMO是一个上层本体论.页面上列出的中级本体(您可以在"东西"和"牛肉卷饼"之间找到概念)不包括食物,但反映了为项目提供资金的各种组织.人们有一个中级本体论.还有一个用于工业(以及工作),包括食品供应商,但如果你吃它,就不要提及墨西哥卷饼.

我的两分钱
100%的WordNet(3.0即最新版本以及旧版本)被映射到SUMO,这可能就是Alex所需要的.与SUMO(或者更确切地说是MILO)相关的中级本体在特定领域中有效,并且目前不包括Foodstuff,但是因为WordNet(包括所有这些日常用品,包括所有这些)不需要利用"SUMO"下的任何正式本体,而是使用Sumo的WordNet映射(可能除了WordNet之外,它再次不是一个本体,但它的非正式和松散的"层次结构"也可能有所帮助.

但是,从两个区域(然后一些;-)?)可能会出现一些困难:

  • SUMO本体的"级别"可能不是您特定应用程序所需的级别.例如,当" Burrito "带来" 食物 "时,在SUMO的顶级实体" "带来了很好的" ",只有通过长链发现" 动物 "(具体地说:鸡肉 - >家禽 - >鸟 - >温暖的_温度 - 体育 - > Vertebrae->动物).
  • Wordnet的覆盖范围和元数据令人印象深刻,但关于中级概念可能有点不一致.例如"我们的"Burrito的上位词是适当的"Dish",它提供了大约140种食物菜肴,其中包括"Soup"或"Casserole"等仿制药以及"Chicken Marengo"(但省略说"Chicken Cacciatore")

在提出这些问题时,我的观点不是批评WordNet或SUMO及其相关本体,而是简单地说明与构建本体相关的一些挑战,特别是在中级.

无论基于SUMO和WordNet的解决方案存在哪些缺陷和缺点,务实地使用这些框架可能"符合要求"(85%的时间)