何时使用图数据库、本体和知识图

Question

何时使用图数据库、本体和知识图

Sha*_*ade 6 ontology graph-databases knowledge-graph

从实际角度来看，我一直在努力理解这些技术何时有用，以及它们之间有何不同。专家可以检查一下我的理解吗？

图形数据库：当关系复杂、继承、以不同程度的置信度推断并且可能发生变化时，图形数据库比关系数据库更容易理解和管理。一些示例：用户不知道他们需要层次结构的深度；从社交媒体推断关系，对 ID 解析、主题解析和关系强度有不同程度的置信度；或者不知道他们要存储什么类型的呼叫中心数据；所有这些都可以存储在关系数据库中，但它们需要不断更新。它们对于某些任务也更具表现力。
本体：这些正式且标准化的知识表示用于打破数据孤岛。例如，假设一家 B2B 销售公司从多个不同的业务领域获得收入，其中包括一次性付款、订阅、IP 销售和咨询服务。收入数据存储在许多不同的数据库中，这些数据库具有很多特性。本体允许用户将“客户付款”定义为“创造或退还收入”的任何内容，以便主题专家可以在其数据库中适当地标记付款。本体可以与图数据库或关系数据库一起使用，但是对类继承的强调使得它们在图数据库中更容易实现，在图数据库中可以轻松地对类的分类进行建模。
知识图：知识图是一种图数据库，其中语言（含义、实体和节点分类法）由本体管理。因此，在我们的 B2B 示例中，“客户付款”边缘具有一次性付款、订阅等子类型，并将“客户”类连接到“业务线”类。

这基本上是正确的吗？

Answer 1

图数据库（GD）是可以存储图数据的数据库，主要具有三种类型的元素：节点、边和属性。两种流行的图数据库类型是（1）基于资源描述框架（RDF）的图数据库，例如。Blazegraph 和 (2) 基于标签传播图 ( LPG ) 的图数据库，例如。Neo4j。RDF 以主谓宾（SVO）三元组的形式表示知识，例如John livesIn London，由于其节点和边无法保存属性，因此需要添加额外的节点或文字来表示属性。LPG 以边、节点和属性的形式表示知识，其中节点和边可以以 key:value 的形式保存属性。例如，一个节点可以有标签“Person”，而“Person”可以有属性名称：Tom Hanks，出生：1956 年。

本体是使用概念实例、实例（和类）属性、类限制和规则（if-then 语句）对概念及其关系的描述。这些规则描述了可以从构成本体描述的整体理论的断言/公理中得出的逻辑推论。上层本体（例如DOLCE）描述一般概念和关系，而领域本体（例如Gene Ontology）描述特定领域中的概念和关系。图数据库可能在其模式级别具有用于逻辑一致性检查的本体。

通常，知识图（KG）是将知识库组织为具有节点和节点之间的链接的图。早期 KG 的一个例子是Wordnet，它捕获单词及其含义之间的语义关系。后来，Google使用从索引网页中提取的RDFa、微数据和JSON-LD内容，在 DBpedia和Freebase 的基础上开发了 Google 知识图谱 ( GKG ) ，并使用schema.org词汇来组织节点。谷歌报告称，它在 GKG 中保存了大约 700 亿条事实。

图数据库支持查询，但不支持需要本体的逻辑推理。如果数据内的联系是主要关注点（例如朋友的朋友），检索比存储更重要，并且数据模型经常变化，那么图数据库将是一个不错的选择。

当我们需要从给定的知识中推断出新的知识时，就需要使用本体论。例如，如果给定（1）苏格拉底是人，（2）所有人都是凡人，那么本体中的推理机或推理机可以推断出新知识（3）苏格拉底是凡人。这是通过 Web 本体语言 ( OWL ) 用于描述资源的描述逻辑公理实现的。OWL 使用资源描述框架 ( RDF ) 进行序列化。

当我们需要检查数据模型的一致性时，也会使用本体。例如，如果一个公理说 Human 和 Sponge 是不相交的类，并且我们将 John（人类）作为 Human 和 Sponge 类的实例，那么它将无法通过一致性测试。

分类法是 IS-A 类层次结构，它构成了本体的支柱。

知识图通常与基于标准 Web 技术（例如 HTTP、RDF、URI和SPARQL ）构建的链接开放数据 ( LOD ) 项目相关联。KG可以使用本体进行推理，使用图数据库来存储知识。一些大型组织已经推出了他们的 KG。

归档时间：	4 年，6 月前
查看次数：	2589 次
最近记录：	2 年，1 月前