docker-compose 中的 Kafka Streams 需要很长时间进行分区分配

sha*_*oes 5 apache-kafka docker docker-compose apache-kafka-streams

我正在 Docker 容器中运行 Kafka 流应用程序。出于测试目的,我有一个 docker-compose 文件,用于运行流应用程序、kafka 的单个实例和 Zookeeper。kafka和zookeeper的配置之前都工作过。

为 kafka 流应用程序分配分区需要花费 5 分钟以上的时间。如果我延迟运行流容器,直到 kafka 和 Zookeeper 启动,并且流应用程序正在使用的主题已正确实例化,那么它几乎立即获得分配的分区。

看起来 kafka 流组正在被实例化,但是,应用程序没有被分配任何分区。这大概是因为该主题尚未完全实例化。直到下一代才会分配分区,这似乎几乎需要 5 分钟。

根据我对情况的(有限)了解,我有几种减少这种延迟的选择:

  • 在启动流应用程序之前检查主题是否具有元数据
  • 减少世代之间的间隔(似乎这在生产中可能会出现问题,但对于测试来说可能没问题)

然而,我意识到考虑到我在这方面的知识有限,我可能会遗漏一些明显的东西。

编辑:docker-compose 文件以供参考

version: 3.3
services:
    kafka-stream-ingestor:
      build:
        context: .
        dockerfile: Dockerfile
        args:
          - version

      networks:
        - services

    zookeeper:
        image: wurstmeister/zookeeper
        ports:
          - 2181:2181
        networks:
          - services

    kafka:
      image: wurstmeister/kafka:latest
      ports:
        - 9094:9094
        - 9092:9092
      environment:
        KAFKA_ADVERTISED_HOST_NAME: ${DOCKER_KAFKA_HOST}
        KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
        KAFKA_LISTENER_SECURITY_PROTOCOL_MAP: INSIDE:PLAINTEXT,OUTSIDE:PLAINTEXT
        KAFKA_ADVERTISED_PROTOCOL_NAME: OUTSIDE
        KAFKA_ADVERTISED_PORT: 9094
        KAFKA_CREATE_TOPICS: "kafka-queue:12:1"
        KAFKA_PROTOCOL_NAME: INSIDE
        KAFKA_PORT: 9092
      volumes:
        - /var/run/docker.sock:/var/run/docker.sock
      networks:
        - services

  networks:
    services:

  volumes:
    testresult:
Run Code Online (Sandbox Code Playgroud)

sha*_*oes 5

我找到了一个临时解决方案,可以在有限的情况下工作(仅需要本地测试或通过集成测试)。我不会将此标记为已解决,以便获得更好的答案。

本质上,流应用程序在分区准备好之前请求元数据。kafka 说“还没有分区”,应用程序说“好吧,没有可以分配的分区”,然后等待一段(可配置的)时间,直到分区元数据变得过时。然后它向 kafka 发出另一个请求,此时 kafka 已经创建了分区。

规定此刷新间隔的配置是kafka.metadata.max.age.ms。我将其设置为 1000 毫秒。