使用Neo4j进行数据挖掘

Ger*_*Ger 3 graph neo4j graph-databases

我是图形数据库的新手,我正在试图决定Neo4j是否适合用于网络图上的数据挖掘,或者是否有更合适的东西.

我打算使用图形数据库对一些大型图形(数百万个节点/ 10s到100万个边缘)进行分析,但我将寻求应用算法并为图中的每个人计算度量.例如:

  • 对于每个人,他们的扩展网络中有多少人具有某种属性.
  • 每个人有多少步骤来自具有某个属性的人.
  • 进行社区检测
  • 运行页面排名

从稍微观察一下,似乎neo4j非常适合从某个节点开始运行查询,但是它是否也适合对网络中的每个人进行计算?我曾经遇到过"图形计算引擎"这个术语作为两者之间的区别,但似乎无法找到它.

是否还有其他工具在这种规模上有用(gephi和类似工具不会处理我需要使用的数据量).

amb*_*amb 5

由于您需要使用图形数据库分析引擎,因此您可能对Faunus感兴趣.这是他们的描述:

Faunus是一个基于Hadoop的图形分析引擎,用于分析跨多机计算集群的图形.

我知道它,因为我一直关注他们的图形数据库Titan,它与Tinkerpop很好地集成,但我没有使用它(Faunus).

因此,通过使用Faunus,您还可以拥有一个图形后端,IMO与您想要做的事情齐头并进.