是否可以通过数据库(而不是集合或shardKey)实现ArangoDB分片?

ZEC*_*nmo 7 database sharding arangodb

我有一个包含大量数据库的大型Arango实例 - 每个项目一个.每个项目数据库都有一堆集合和大量数据.数据库看起来像

project1
project2
project3
...
project500
Run Code Online (Sandbox Code Playgroud)

我想通过分片实例来分发查询负载,以便每个项目数据库在单独的服务器上运行,或者启动多个大型主机并让Arango自动设置.但是,似乎ArangoDB分片只能在集合级别工作(例如,通过集合中的记录_key).

有没有办法按数据库设置分片?如果没有,是否有运行/编排多个Arango实例的最佳实践?

小智 6

运行多个实例的选项之一是使用Docker Swarm.通过下面的示例,您可以运行ArangoDB的多个实例

你需要

然后保存下面的代码为 docker-stack-arango.yml

version: '3.3'

services:
  arangodb:
    image: "${ARANGO_IMAGE}"
    environment:
      ARANGO_ROOT_PASSWORD: "${ARANGO_ROOT_PASSWORD}"
      ARANGO_STORAGE_ENGINE: "${ARANGO_STORAGE_ENGINE}"
    volumes:
      - arangodb:/var/lib/arangodb3
      - arangodb_apps:/var/lib/arangodb3-apps
    ports:
      - target: 8529
        published: $ARANGO_PUBLISHED_PORT
        protocol: tcp
        mode: ingress
    deploy:
      mode: replicated
      replicas: 1
      endpoint_mode: vip
      placement:
        constraints:
          - node.labels.group==$INSTANCE_GROUP
      resources:
        limits:
          cpus: $LIMITS_CPU
          memory: $LIMITS_MEMORY
      restart_policy:
        condition: any
        delay: 5s
        max_attempts: 3
        window: 60s
      update_config:
        parallelism: 1
        delay: 30s
    stop_grace_period: 60s

volumes:
  arangodb:
    external:
      name: ${ARANGO_VOLUME}
  arangodb_apps:
    external:
      name: ${ARANGO_APPS_VOLUME}
Run Code Online (Sandbox Code Playgroud)

在shell/bash中更新并运行config

export INSTANCE_GROUP="group1"
export INSTANCE_NAME="arango1"
export INSTANCE_PORT=8529
export INSTANCE_PASSWORD="do-not-use-this-password-in-production"

export ARANGO_IMAGE_TAG="3.4.0"
export ARANGO_IMAGE_REPO="arangodb/arangodb"
export ARANGO_IMAGE="${ARANGO_IMAGE_REPO}:${ARANGO_IMAGE_TAG}"
export ARANGO_VOLUME="arangodb-${INSTANCE_NAME}--3.4.0"
export ARANGO_APPS_VOLUME="arangodb-apps-${INSTANCE_NAME}--3.4.0"
export ARANGO_PUBLISHED_PORT=$INSTANCE_PORT
export ARANGO_STORAGE_ENGINE="rocksdb"
export ARANGO_ROOT_PASSWORD=$INSTANCE_PASSWORD
export LIMITS_CPU=1
export LIMITS_MEMORY=1024M
Run Code Online (Sandbox Code Playgroud)

然后运行deploy

docker stack deploy -c ./docker-stack-arango.yml $INSTANCE_NAME
Run Code Online (Sandbox Code Playgroud)

部署第二个实例更改INSTANCE_NAME,INSTANCE_PORT然后INSTANCE_GROUP再次运行deploy

然后你可以通过配置端口的任何节点的ip访问实例


Kav*_*our 4

不会。实施分片的唯一目的是在多个数据库服务器上分发任何集合的文档。这是在 ArangoDB 集群上实现内存和负载平衡的一种方法。