使用freebase命名实体识别

Vin*_*odh 7 freebase dbpedia spotlight-dbpedia

我理解DBPedia聚光灯对给定文档进行了命名实体识别.为此,它使用存储在文件系统中的下载的DBPedia文件.请参阅URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR.

我需要的是一个等效的API,如Freebase的聚光灯.就像我浏览的那样,我找不到任何在Freebase三元店上运行的工具/ API.有人可以帮忙吗?

Sha*_*ter 3

目前 Freebase 中没有用于命名实体识别的等效项目。但是,Freebase 在SameAs.org上有到 DBpedia 的链接,因此您可以使用 DBpedia Spotlight,然后将 ID 解析回 Freebase(该数据也可以在Freebase RDF 转储中找到)。

如果您正在寻找该领域的编码项目,我认为应该可以调整 DBpedia Spotlight 代码,以便您可以使用 Freebase 数据训练其模型。这样做的主要好处是 Freebase 比 DBpedia 涵盖更广泛的实体,因此您可以更好地回忆。此外,您还可以利用 Freebase 中的其他数据(例如“值得注意的类型”)来获得更好的精度。

通过查看 Freebase 中的 /type/object/name 和 /common/topic/alias 属性,您应该能够获得实体的一组良好的“表面形式”。与 Wikipedia 页面对应的任何 Freebase 实体都将在 /wikipedia/en 命名空间中具有一个或多个 /type/object/key 值。这些对应于 Wikipedia 页面名称(和重定向),这将允许您解析 Wikipedia XML 转储并识别页面上的哪些链接对应于 Freebase 主题。此处描述了 Freebase 密钥编码方案。

您可能还对OpenCalaisAlchemyAPI感兴趣,它们提供命名实体识别服务,并在其 API 响应中提供 Freebase ID。