Web 应用程序中的 Gremlin Python

Max*_*ter 5 python gremlin janusgraph gremlinpython

我有一个 python flask web 应用程序,它使用gremlin_python. 一个基本问题是初始化图遍历对象的正确方法。

  1. 我可以初始化我的遍历g = traversal().withRemote(DriverRemoteConnection(...)g跨请求保留遍历变量吗?(所有请求都针对同一个图表。我尝试了这个并开始tornado.iostream.StreamClosedError断断续续。
  2. 第二个选项是为每个请求创建一个遍历。我不太了解 gremlin python 架构;每个请求执行此操作是否有大量开销?

谢谢你

Wol*_*ahl 2

Gremlin Python 是 Gremlin 语言变体实现,请参阅http://tinkerpop.apache.org/docs/current/tutorials/gremlin-language-variants/

因此,它确实依赖 GremlinServer 来执行遍历。

分配:

g = traversal().withRemote(DriverRemoteConnection('ws://localhost:8182/gremlin','g'))
Run Code Online (Sandbox Code Playgroud)

将打开到服务器的 websocket 连接。不存在通过保留该连接的副本来“持久”这样的事情。持久化机制全部发生在服务器端。当我尝试以下代码时,我发现了这一点:

from gremlin_python.process.anonymous_traversal import traversal
from gremlin_python.driver.driver_remote_connection import DriverRemoteConnection
import os

g = traversal().withRemote(DriverRemoteConnection('ws://localhost:8182/gremlin','g'))

# test loading a graph
def test_loadGraph():
   # make the local file accessible to the server
   airRoutesPath=os.path.abspath("air-routes-small.xml")
   # drop the existing content of the graph
   g.V().drop().iterate()
   # read the content from the air routes example
   g.io(airRoutesPath).read().iterate()
   vCount=g.V().count().next()
   assert vCount==1000
Run Code Online (Sandbox Code Playgroud)

上面的代码可以运行并加载航线示例。但它破坏了所有其他测试,因为现在下面提到的教程中使用的服务器的默认现代图已经消失了!

您可以打开与服务器的多个 websocket 连接,但它们都共享底层图的相同“状态”。坏消息是,通过 API 影响这种状态并不容易,这是当前架构的故意决定。目前涉及大量配置 yaml 和属性文件以及启动和停止服务器。

我的改进提案https://issues.apache.org/jira/projects/TINKERPOP/issues/TINKERPOP-2294?filter=allopenissues是基于这种方法带来的挫败感。

特别是我分享你的“我不太了解 gremlin python 架构”。恕我直言,这并不是因为你或我在理解它方面有问题,而是因为它解释得不够好。特别是缺少例子。这就是我开始的原因:http://wiki.bitplan.com/index.php/Gremlin_python - 一个旨在让 gremlin python 入门变得不那么痛苦的教程。