小编Vij*_*its的帖子

使用和缩放Titan Graph数据库

我正在计算我存储分层数据的选项(父子关系).

由于树是图形而森林(树木)在技术上也是图形,因此图形数据库似乎比RDBMS esp更适合该法案.因为我关心优化读写操作.

  • 优化写入意味着层次结构的更改需要最少的写入.
  • 优化读取意味着实现特定节点消费者最小读取操作的完整路径.

我的用例是:

  • 每个用户一棵树.我应该在用户空间中存储和使用一个图表,还是每个用户使用一个图表?
  • 路径查询从任何节点开始并返回到用户的树根.
  • 子节点存储指向父节点的链接

由于我的所有资源都在AWS中,因此能够使用Titan DynamoDB后端似乎是理想的选择.

我真正的问题在于了解如何扩展和管理Titan.

  1. 我需要一个gremlin服务器实例吗?换句话说,为了对Titan做任何事情,我是否需要使用gremlin服务器站起EC2实例?或者我可以使用Java Titan API直接处理图形数据吗?

  2. 我是否需要明确地对数据进行分片?换句话说,随着使用量的增加以及数据量和操作量的增加,我是否需要站起来使用更多的gremlin服务器?当服务器数量向外扩展时,我是否需要从客户端跨这些服务器进行一致性哈希才能执行操作?

  3. 我是否需要设置弹性搜索集群才能从任何节点开始遍历?或者是使用顶点来表示对象和边缘以表示此时足够的父关系?我可以保证顶点ID在用户空间中是唯一的; 我也可以用唯一的用户ID装饰每个顶点.在那种情况下,我需要弹性搜索吗?我希望弹性搜索是针对自由格式或更复杂的搜索类型查询而不是针对确切的查询!

  4. 随着前端数量的增加,每个前端可以打开图形(跨用户空间的单个图形)吗?如果每个用户的图形,然后由于前端没有亲和力,可以为每个用户打开相同的图形; 这可以吗?

我无法找到任何关于此的文档.谢谢!

graph bigdata amazon-web-services titan

1
推荐指数
1
解决办法
277
查看次数

标签 统计

amazon-web-services ×1

bigdata ×1

graph ×1

titan ×1