慢速 Datascript 查询

Hen*_*gon 3 clojure datascript

我正在使用 Datascript 查询具有给定名称的 2 个节点的最后一个共同祖先的树结构,是我到目前为止所得到的,但它真的很慢 - 知道为什么(或者有更好的方法)?

(defn lca
  "Last common ancestor"
  [db name1 name2]
  (d/q '[
          :find [(pull ?anc [:db/id :name]) ...]
          :in    $ % ?name1 ?name2
          :where
            (?node1 :name ?name1)
            (?node2 :name ?name2)
            (anc ?anc1 ?node1)
            (anc ?anc2 ?node2)
            [(not= ?anc1 ?anc2)]
            (parent ?anc ?anc1)
            (parent ?anc ?anc2)
          ]
          @db
          '[
            [ (parent ?par ?child)
              (?par :children ?child)]
            [ (anc ?par ?child)
              (?par :children ?child)]
            [ (anc ?anc ?child)
              (?par :children ?child)
              (anc ?anc ?par)]
            ]
          name1
          name2))
Run Code Online (Sandbox Code Playgroud)

我最初打算用来not排除所有比最后一个公共祖先更高的祖先,但 Datascript 目前不支持not因此这两个父子句。

架构是:

:children {:db/valueType :db.type/ref 
           :db/cardinality :db.cardinality/many 
           :db/index true}
:name {:db/index true}
Run Code Online (Sandbox Code Playgroud)

Nik*_*pov 5

好吧,递归规则并不是 DataScript 中最快的东西。因此,您可以通过将parent规则直接内联到查询代码中来加快查询速度。

另一件事是查询不是最快的东西也是 DataScript。解析查询、分配中间集合、迭代它们、管理变量等花费了相当多的时间。在两种情况下,您可以更喜欢查询而不是手动数据库/索引访问:

  1. 查询的运行速度比您自己编写的要快(例如,在处理大型关系时,查询将使用哈希连接,手动编写非常繁琐)
  2. 查询以比命令式算法更简单的方式表达您的问题

在你的情况下,这些都不是真的(你并没有真正处理关系,你线性地走图)。此外,还有一个错误:如果 node1 和 node2 具有共同的直接父级,您的查询将不起作用。

我推荐的是通过直接访问实体来做同样的事情。实体只是索引查找,没有任何与查询相关的开销,因此在如此简单的情况下,它们应该工作得更快。

这样的事情应该足够了:

(defn parent [node]
  (first (:_children node)))


(defn ancestors [node]
  (->> node
       (iterate parent)
       (take-while some?)
       reverse))


(defn last-common-ancestor [db name1 name2]
  (let [node1 (d/entity db [:name name1])
        node2 (d/entity db [:name name2])]
         ;; zipping ancestor chains together
    (->> (map vector (ancestors node1) (ancestors node2))
         ;; selecting common prefix
         (take-while (fn [[ac1 ac2]] (= ac1 ac2)))
         ;; last item in common prefix is what you looking for
         (last))))
Run Code Online (Sandbox Code Playgroud)