Sha*_*ade 6 ontology graph-databases knowledge-graph
从实际角度来看,我一直在努力理解这些技术何时有用,以及它们之间有何不同。专家可以检查一下我的理解吗?
图形数据库:当关系复杂、继承、以不同程度的置信度推断并且可能发生变化时,图形数据库比关系数据库更容易理解和管理。一些示例:用户不知道他们需要层次结构的深度;从社交媒体推断关系,对 ID 解析、主题解析和关系强度有不同程度的置信度;或者不知道他们要存储什么类型的呼叫中心数据;所有这些都可以存储在关系数据库中,但它们需要不断更新。它们对于某些任务也更具表现力。
本体:这些正式且标准化的知识表示用于打破数据孤岛。例如,假设一家 B2B 销售公司从多个不同的业务领域获得收入,其中包括一次性付款、订阅、IP 销售和咨询服务。收入数据存储在许多不同的数据库中,这些数据库具有很多特性。本体允许用户将“客户付款”定义为“创造或退还收入”的任何内容,以便主题专家可以在其数据库中适当地标记付款。本体可以与图数据库或关系数据库一起使用,但是对类继承的强调使得它们在图数据库中更容易实现,在图数据库中可以轻松地对类的分类进行建模。
知识图:知识图是一种图数据库,其中语言(含义、实体和节点分类法)由本体管理。因此,在我们的 B2B 示例中,“客户付款”边缘具有一次性付款、订阅等子类型,并将“客户”类连接到“业务线”类。
这基本上是正确的吗?
小智 9
图数据库(GD)是可以存储图数据的数据库,主要具有三种类型的元素:节点、边和属性。两种流行的图数据库类型是(1)基于资源描述框架(RDF)的图数据库,例如。Blazegraph 和 (2) 基于标签传播图 ( LPG ) 的图数据库,例如。Neo4j。RDF 以主谓宾(SVO)三元组的形式表示知识,例如John livesIn London,由于其节点和边无法保存属性,因此需要添加额外的节点或文字来表示属性。LPG 以边、节点和属性的形式表示知识,其中节点和边可以以 key:value 的形式保存属性。例如,一个节点可以有标签“Person”,而“Person”可以有属性名称:Tom Hanks,出生:1956 年。
本体是使用概念实例、实例(和类)属性、类限制和规则(if-then 语句)对概念及其关系的描述。这些规则描述了可以从构成本体描述的整体理论的断言/公理中得出的逻辑推论。上层本体(例如DOLCE)描述一般概念和关系,而领域本体(例如Gene Ontology)描述特定领域中的概念和关系。图数据库可能在其模式级别具有用于逻辑一致性检查的本体。
通常,知识图(KG)是将知识库组织为具有节点和节点之间的链接的图。早期 KG 的一个例子是Wordnet,它捕获单词及其含义之间的语义关系。后来,Google使用从索引网页中提取的RDFa、微数据和JSON-LD内容,在DBpedia和Freebase 的基础上开发了 Google 知识图谱 ( GKG ) ,并使用schema.org词汇来组织节点。谷歌报告称,它在 GKG 中保存了大约 700 亿条事实。
图数据库支持查询,但不支持需要本体的逻辑推理。如果数据内的联系是主要关注点(例如朋友的朋友),检索比存储更重要,并且数据模型经常变化,那么图数据库将是一个不错的选择。
当我们需要从给定的知识中推断出新的知识时,就需要使用本体论。例如,如果给定(1)苏格拉底是人,(2)所有人都是凡人,那么本体中的推理机或推理机可以推断出新知识(3)苏格拉底是凡人。这是通过 Web 本体语言 ( OWL ) 用于描述资源的描述逻辑公理实现的。OWL 使用资源描述框架 ( RDF ) 进行序列化。
当我们需要检查数据模型的一致性时,也会使用本体。例如,如果一个公理说 Human 和 Sponge 是不相交的类,并且我们将 John(人类)作为 Human 和 Sponge 类的实例,那么它将无法通过一致性测试。
分类法是 IS-A 类层次结构,它构成了本体的支柱。
知识图通常与基于标准 Web 技术(例如 HTTP、RDF、URI和SPARQL )构建的链接开放数据 ( LOD ) 项目相关联。KG可以使用本体进行推理,使用图数据库来存储知识。一些大型组织已经推出了他们的 KG。