要添加到 @abarisone\ 的答案,WordNet 3.0 和 WordNet 3.1 之间的实际同义词集 ID 本身可能有所不同:(
\n\n例如,在 WordNet 3.1 中,椅子是103005231-n。
\n\n然而,在 WordNet 3.0 中它是 103001627-n。但是您无法在http://wordnet-rdf.princeton.edu/wn31/103001627-n或http://wordnet-rdf.princeton.edu/wn30/103001627-n中查找,而是需要使用http ://wordnet-rdf.princeton.edu/wn30/03001627-n错误地重定向到102992974-n。
\n\n我认为这是WordNet RDF 3.1 在线应用程序中的一个错误,因为102992974-n并不正式存在。您甚至无法搜索它(在线和离线)。如果您在该页面上获取 RDF/JSON-LD 文件,它会为您提供103005231-n。
\n\n在wn3.1.dict/dict/index.noun:
chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 \nRun Code Online (Sandbox Code Playgroud)\n\n该文件中没有提及02992974任何地方。
这两个问题都令人困惑。我想知道为什么他们在较小的修订中更改了同义词集 ID。
\n\n关于 WordNet 同义词集 ID 的状态:
\n\n结论是,目前使用 WordNet 3.0 同义词集 ID 是最安全的。
\n\n对于未来的工作,可以考虑使用全球 Wordnet 协会的跨语言索引(即将推出)。其中 ID 与 Wordnet 3.0 兼容。
\n\n引用自wn-users 邮件列表,2015 年 10 月 30 日:
\n\n\n\n\n作者:拉斐尔、尼古拉斯
\n\nURI 是从 \xe2\x80\x9cdblocation\xe2\x80\x9d 字段构建的,该字段是距相关基于字符的数据库文件开头的字节偏移\n(I\xe2\x80\x99m\n 不确定哪个)。随着项目的删除、添加和移动,这将随着版本的不同而改变。
\n
。
\n\n\n\n\n作者:彼得·克拉克
\n\n据我所知\xe2\x80\xa6。仅供参考,一个鲜为人知的事实是\n 感知键(例如\xe2\x80\x9cability%1:07:00::\xe2\x80\x9d)在版本之间是稳定的,\n 除非感知被拆分或合并。这提供了一种跨版本引用同义词集的稳定方法,而不是使用同义词集编号。此外,您还可以通过查找相同的感知键来找到不同版本中同义词集编号之间的映射。(sensekey->synset 是多对一映射:一个同义词集可能有多个意义键,一个对应于同义词集中的每个单词+意义。但一个意义键恰好映射到一个同义词集)。\n 最佳祝愿,皮特
\n
。
\n\n\n\n发件人:约翰·麦克雷
\n\n你好亨迪,
\n\n是的,WordNet 同义词集标识符基于给定版本的 WordNet 中描述符的字节偏移量,因此它们在不同版本的 WordNet 中远非稳定。意义标识符更加\n 稳定,但仍然可能不可靠,因为意义确实会被分割和合并。\n 另外,WordNet 3.1 有两个略有不同的版本,\n WordNet RDF 版本接受来自以下任一版本的同义词集标识符...当然,正如其他人评论的那样,这一切都非常令人困惑。
\n\n为此,全球 WordNet 协会已开始制定\n 跨语言索引,我们预计该索引将很快上线(即赶在 1 月份的全球 WordNet 会议\n 之前),并将给出每个\n 同义词集单个不变的 URI。
\n\nPiek Vossen 最近对此进行了很好的演讲,此幻灯片位于此处:http ://ldl2014.org/slides/Vossen-LOD-CILI.pdf
\n\n目前,我建议使用 WN 3.0 标识符来链接同义词集,WordNet 语际索引也将以此为基础。
\n\n问候,约翰
\n
| 归档时间: |
|
| 查看次数: |
1637 次 |
| 最近记录: |