图表数据库与三重商店

Nik*_*sov 26 triplestore graph-databases

目前保持图形结构的最佳选择是什么?图形数据库(例如Neo4j)或RDF三重存储(例如Virtuoso)?

例如,我们有以下用例:

  • 弱连通图(类似于集合中的学术论文之一),具有近10M节点;
  • 非常罕见的更新;
  • 关键操作:检索特定子图,更新给定子图中的节点,在更新某些节点后重新计算链接分析度量(例如HITS或PageRank).

还需要提供标准API来查询第三方应用程序(Facebook或Twitter)的数据.

小智 11

使用Virtuoso,您可以为您工作:

- SPARQL,SQL,SPASQL(SQL中的SPARQL)和SPARQL内部的SQL支持(例如,通过魔术/函数谓词/属性处理N元关系).

- 作为紧凑型引擎(例如,通过KDE桌面利用)或大规模DBMS,通过实时17亿三元组+ LOD云缓存或较小的DBpedia实时实例演示.

- 包括SPARQL中的全文索引和文本模式(通过bif:contains)它还包括XPath/Xquery(通过xcontains)

- 酸性或非酸性模式同上Schema-Last处理Property Graph Store时

- 通过Transformation Middleware,它可以从80多个数据源(包括REST API,SOAP服务,超媒体资源,ODBC或JDBC可访问的关系数据源等)中提取数据,并转换为瞬态或持久链接数据图

- 链接数据发布是自动的,即在创建DBMS记录后,您将内置的链接数据页作为DBMS的视图.没有乱搞.URL-Rewrite规则,303重定向或类似的东西.InterWeb规模超级密钥正常工作!

那就是现在:-)


Ope*_*ara 8

对于水平尺度(因此中小型数据库),像neo4j这样的图形数据库目前将为图形遍历提供更好的性能.三重商店正在迎头赶上.与图形数据库相比,三重存储的一大优势是数据转储和查询语言是标准化的,这意味着它更容易转移到另一个产品并阻止供应商锁定.

  • 请问您能提供这种性能比较的链接吗?他们都报告了他们处理数十亿物品的能力. (2认同)
  • 我们在两个四个商店和Neo4j之间为OpenSahara做了一些内部基准测试,几乎所有图形行走算法都发现Neo4j更快,但无论如何都决定使用四元组.我不打算发布那些基准测试,因为它们实际上只对我们拥有的数据类型,我们认为当时将使用的图形算法,一个特定数据集的大小和性质以及所有设置都有用.我们没有在任何这些数据库上做过调整. (2认同)