如何为 Kubernetes 中托管的多个应用程序选择 Kafka 事务 ID?

Den*_*nis 4 java apache-kafka kubernetes kafka-producer-api spring-kafka

我有一个经典的微服务架构。所以,有不同的应用。每个应用程序可能有1..N实例。系统部署到Kubernetes.所以,我们有很多不同PODs,可以随时启动和停止。

我想实现读取-处理-写入模式,所以我需要 Kafka 事务。

要配置事务,我需要transaction id为每个 Kafka 生产者设置一些事务。(实际上,我需要transaction-id-prefix,因为我在我的应用程序中使用Spring,并且它有这样的API)。应用程序重新启动后,这些IDs必须相同。

那么,如何为 Kubernetes 中托管的多个应用程序选择 Kafka 事务 ID?

Gar*_*ell 6

如果消费者启动事务(读取-处理-写入),则同一应用程序的所有实例的事务 ID 前缀必须相同(以便僵尸防护在重新平衡后正常工作)。实际使用的交易ID是<prefix><group>.<topic>.<partition>

如果您有多个应用程序,它们应该具有唯一的前缀(尽管如果它们从不同的主题消费,它们无论如何都是唯一的)。

对于仅限生产者的交易,前缀在每个实例中必须是唯一的(以防止 kafka 屏蔽生产者)。

编辑

请注意,KIP-447改变了这一切;不再需要(使用EOSMode.V2aka时BETA)保持交易 id 相同 - 消费者元数据用于隔离。

  • 不,正如我所说,如果您使用读取进程写入,则必须对所有实例使用相同的前缀,是的,每次重新启动后它必须相同。如果其中一个实例发生故障,kafka 将重新平衡,并且这些分区的新消费者必须使用已失效实例使用的相同“transactional.id”。 (2认同)