小编Ami*_*mit的帖子

使用cypher检测neo4j属性图中的循环

使用密码检测相当大的图形中的循环的最佳方法是什么.

我有一个图表,它有大约250000个节点和大约270000个关系,我想检测大约10k节点的子图中的周期,并涉及100k关系.我写的密码就像

start 
      n = node:node_auto_index(some lucene query that returns about 10k nodes)

match
    p =  n-[:r1|r2|r3*]->n
return p
Run Code Online (Sandbox Code Playgroud)

然而,这并不是非常有效.

有人可以建议一个更好的方法来做到这一点.

graph cycle neo4j cypher

13
推荐指数
1
解决办法
1808
查看次数

Spark DataFrame 缓存不断增长

spark 如何决定复制缓存分区的次数?

spark UI 上存储选项卡中的存储级别显示“磁盘序列化 1x 复制”,但看起来分区被复制到多个执行程序上。我们已经注意到这种情况发生在DISK_ONLY使用spark 2.3. 我们正在缓存一个数据集101 partitions(磁盘大小为 468.4 GB)。数据最初分布在 101 个执行者上(我们总共有 600 个执行者)。当我们在这个数据集上运行查询时,磁盘上的大小和分布的执行器数据的数量都会增加。我们还注意到,通常一个块/分区会被复制到同一节点上的多个执行器上——如果它存储在磁盘上,为什么不在同一节点上的执行器之间共享呢?

persistedDs = dataset.repartition(101).persist(StorageLevel.DISK_ONLY)
Run Code Online (Sandbox Code Playgroud)
  • 初始负载

    初始负载

  • 在缓存数据集上运行查询之后

    在此处输入图片说明

  • 一个 executor 可以缓存 2 个分区。另外,请注意,RDD 在附加的屏幕截图中被多次缓存。

    在此处输入图片说明

  • 101个Executor上的数据分布

    在此处输入图片说明

hadoop scala bigdata apache-spark

6
推荐指数
1
解决办法
296
查看次数

SPARQL中的任意路径长度查询

是否可以在SPARQL中执行任意长度的路径查询.假设我有neo4j商店,它有一个只代表PARENT_OF关系的图表(例如,考虑一个家族树).获取一个人的所有祖先的密码查询看起来像

start n (some node from index query) match n<-[:PARENT_OF*]-k return k
Run Code Online (Sandbox Code Playgroud)

如果将此neo存储表示为基于RDF的三元组存储,那么此查询在SPARQL中的外观如何?这甚至是可能的吗?

rdf sparql neo4j

5
推荐指数
1
解决办法
447
查看次数

使用jackson时忽略属性和访问器

我有一个POJO,我需要序列化为JSON.POJO有很多属性,我想将其中的一些属性序列化为JSON表示.我正在使用杰克逊序列化.由于我想忽略很多属性,因此将每个属性注释为@JsonIgnore看起来非常难看

有没有办法告诉jackson或将objectMapper配置为仅在注释为@JsonProperty时包含属性,并忽略其余而不指定@JsonIgnore.

java rest json jax-rs jackson

2
推荐指数
1
解决办法
1470
查看次数

标签 统计

neo4j ×2

apache-spark ×1

bigdata ×1

cycle ×1

cypher ×1

graph ×1

hadoop ×1

jackson ×1

java ×1

jax-rs ×1

json ×1

rdf ×1

rest ×1

scala ×1

sparql ×1