Dav*_*les 2 java graph-databases gremlin tinkerpop3
给定一个树结构的 TinkerPop 图,其顶点由标记的父子关系 ( [parent-PARENT_CHILD->child]) 连接,遍历和查找所有这些节点的惯用方法是什么?
我是图形遍历的新手,因此使用递归函数遍历它们似乎或多或少很简单:
Stream<Vertex> depthFirst(Vertex v) {
Stream<Vertex> selfStream = Stream.of(v);
Iterator<Vertex> childIterator = v.vertices(Direction.OUT, PARENT_CHILD);
if (childIterator.hasNext()) {
return selfStream.appendAll(
Stream.ofAll(() -> childIterator)
.flatMap(this::depthFirst)
);
}
return selfStream;
}
Run Code Online (Sandbox Code Playgroud)
(注意本示例使用Vavr流,但 Java 流版本类似,只是稍微冗长一些。)
我认为图原生实现的性能会更高,尤其是在内存中 TinkerGraph 以外的数据库上。
但是,当我查看 TinkerPop tree recipes 时,不清楚repeat()/until()等的哪种组合适合做我想做的事。
如果我只想找到那些具有特定标签的顶点(叶子或分支),同样,我可以看到如何使用上面的函数来做到这一点:
Stream<Vertex> nodesWithMyLabel = depthFirst(root)
.filter(v -> "myLabel".equals(v.label()));
Run Code Online (Sandbox Code Playgroud)
但这远不是很明显,这是有效的,我认为必须有更好的图形原生方法。
如果您使用 TinkerPop,最好只使用 Gremlin 编写遍历。让我们使用配方中描述的树:
g.addV().property(id, 'A').as('a').
addV().property(id, 'B').as('b').
addV().property(id, 'C').as('c').
addV().property(id, 'D').as('d').
addV().property(id, 'E').as('e').
addV().property(id, 'F').as('f').
addV().property(id, 'G').as('g').
addE('hasParent').from('a').to('b').
addE('hasParent').from('b').to('c').
addE('hasParent').from('d').to('c').
addE('hasParent').from('c').to('e').
addE('hasParent').from('e').to('f').
addE('hasParent').from('g').to('f').iterate()
Run Code Online (Sandbox Code Playgroud)
要找到“A”的所有孩子,您只需执行以下操作:
gremlin> g.V('A').repeat(out()).emit()
==>v[B]
==>v[C]
==>v[E]
==>v[F]
Run Code Online (Sandbox Code Playgroud)
上面的遍历基本上是说,“从 'A”顶点开始,遍历出边,直到没有更多边,哦,顺便说一句,随你发射每个子顶点。”如果你还想得到根的“A”那么你只需要稍微改变一下:
gremlin> g.V('A').emit().repeat(out())
==>v[A]
==>v[B]
==>v[C]
==>v[E]
==>v[F]
Run Code Online (Sandbox Code Playgroud)
更进一步,如果您只想根据某个过滤器(在您的问题中指定标签)发出某些顶点,您只需向emit(). 在这种情况下,我只发出具有多个传入边的顶点:
gremlin> g.V('A').emit(inE().count().is(gt(1))).repeat(out())
==>v[C]
==>v[F]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
927 次 |
| 最近记录: |