Datastax 中的 Gremlin count() 查询太慢

ahm*_*mad 2 gremlin datastax-enterprise-graph

我在 datastax 企业中有 3 个节点,并在这些节点上加载了 6500 万个顶点和边。当我使用 dse studio 或 gremlin 控制台并在我的图表上运行 gremlin 查询时,查询速度太慢。我定义了任何类型的索引并再次测试但没有效果。当我运行查询例如“gv().count()”时,cpu 使用率和 cpu 平均负载没有太大变化,而如果我运行 cql 查询,则分布在所有节点上,所有节点上的 cpu 使用率和 cpu 平均负载是一个重大变化在这种情况下,高效 gremlin 查询的最佳实践或最佳配置是什么?

ste*_*tte 5

count()对于您正在使用的大小的图形,应该通过 OLAP 和 Spark 执行基于遍历。如果您使用基于标准 OLTP 的遍历,则此类查询的等待时间可能会很长。

请注意,此规则适用于任何必须执行“表扫描”(即触摸图中的所有或很大一部分顶点/边)的图计算。这个问题也不是 DSE Graph 特有的,几乎适用于任何图形数据库。