WordNet是如何形成的

xia*_*012 2 nlp wordnet

我想知道如何检索WordNet之间的层次关系.

是手动完成还是通过计算机技术.

如果基于计算机技术,它们是什么?

cyb*_*org 5

来自FAQ:

q.1.2你在哪里获得WordNet的定义?(简答)我们的词典编纂者写这些.

你在哪里获得WordNet的定义?(长答案)从前言到WordNet:电子词汇数据库,pp.xviii-xix:

人们有时会问:"你从哪里得到你的话?" 我们从1985年开始用Kučera和弗朗西斯的现代编辑英语标准语料库(熟悉的布朗语料库)中的词语开始,主要是因为它们为不同的词性提供了频率.亨利·库切拉警告我们,虽然他和弗朗西斯拥有布朗语料库,但我们很好地进入了这个名单,但语法标签数据已被卖给了霍顿米夫林.因此,我们放弃了使用频率计数的计划(1988年Richard Beckwith开发了一个我们使用的多义指数).我们还结合了Charles Osgood用于开发语义差异的所有形容词对.因为同义词对我们来说至关重要,所以我们在各种语言中查找单词:例如,Laurence Urdang的小"同义词和反义词的基本书"(1978),Urdang对Rodale的"同义词查找器"(1978)的修订,以及Robert查普曼的第四版"罗杰的国际词库"(1977) - 在这样的作品中,一个词很快就会引领其他人.1986年末,我们收到了Fred Chang在海军人事研究与发展中心编制的一系列单词,我们将其与自己的名单进行了对比; 我们沮丧地发现只有15%的重叠.

所以张的名单成了输入.1993年,我们获得了Ralph Grishman及其在纽约大学的同事们在他们的共同词典COMLEX中列出的39,143个单词的清单; 这次我们感到沮丧的是,WordNet只包含74%的COMLEX单词.但是那个名单也成了输入.简而言之,各种来源都有所贡献; 我们在建立词汇方面没有很好的纪律.事实是英语词汇非常大,我们很幸运,当我们慢慢爬上山时,我们的赞助商对我们很耐心.