Amazon MSK 默认配置和交易发布问题

Gra*_*ray 5 transactions apache-kafka aws-msk

最近,我们开始对 Kafka 连接器与 MSK(Amazon 托管的 Kafka 服务)进行一些测试。发布记录似乎工作正常,但在启用事务时则不然。

我们的集群由 2 个使用默认 MSK 配置的代理(因为我们有 2 个区域)组成。我们正在使用以下属性创建 Java Kafka 生产者:

bootstrap.servers=x.us-east-1.amazonaws.com:9094,y.us-east-1.amazonaws.com:9094
client.id=kafkautil
max.block.ms=5000
request.timeout.ms=5000
security.protocol=SSL
transactional.id=transactions 
Run Code Online (Sandbox Code Playgroud)

但是,当生产者以transactional.id启用事务的设置启动时,该initTransactions()方法会挂起:

producer = new KafkaProducer<Object, Object>(kafkaProperties);
if (kafkaProperties.containsKey(ProducerConfig.TRANSACTIONAL_ID_CONFIG)) {
    // this hangs
    producer.initTransactions();
}
Run Code Online (Sandbox Code Playgroud)

查看日志输出,我们看到以下流,并且似乎从未超时。

TransactionManager - Enqueuing transactional request (type=FindCoordinatorRequest,
    coordinatorKey=y, coordinatorType=TRANSACTION)
TransactionManager - Request (type=FindCoordinatorRequest, coordinatorKey=y,
    coordinatorType=TRANSACTION) dequeued for sending
NetworkClient - Found least loaded node z:9094 (id: -2 rack: null) connected with no
    in-flight requests
Sender - Sending transactional request (type=FindCoordinatorRequest, coordinatorKey=y,
    coordinatorType=TRANSACTION) to node z (id: -2 rack: null)
NetworkClient - Sending FIND_COORDINATOR {coordinator_key=y,coordinator_type=1} with
    correlation id 424 to node -2
NetworkClient - Completed receive from node -2 for FIND_COORDINATOR with
    correlation id 424, received {throttle_time_ms=0,error_code=15,error_message=null,
    coordinator={node_id=-1,host=,port=-1}}
TransactionManager LogContext.java:129 - Received transactional response
    FindCoordinatorResponse(throttleTimeMs=0, errorMessage='null', 
    error=COORDINATOR_NOT_AVAILABLE, node=:-1 (id: -1 rack: null)) for request
    (type=FindCoordinatorRequest, coordinatorKey=xxx, coordinatorType=TRANSACTION)
Run Code Online (Sandbox Code Playgroud)

据我所知,经纪人可用,并且该属性中的每个主机bootstrap.servers均可用。如果我连接到它们中的每一个并在没有事务的情况下发布,那么它就可以工作。

知道我们缺少什么吗?

Gra*_*ray 7

然而,当生产者使用启用事务的 transactional.id 设置启动时, initTransactions() 方法会挂起:

事实证明,默认 AWS MSK 属性和代理数量存在问题。如果您创建的Kafka集群少于3个broker,则需要调整以下设置。

(我认为)应将以下设置设置为经纪人的数量:

财产 卡夫卡
默认值
AWS
默认值
描述
默认复制因子 1 3 自动创建主题的默认复制因子。
最小同步副本数 1 2 必须确认写入才能被视为成功的最小副本数
偏移量.主题.复制.因子 3 3 共享主题偏移量的内部主题。
事务.状态.日志.复制.因子 3 3 事务主题的复制因子。

这是有关代理属性的 Kafka 文档

因为我们有 2 个经纪人,所以我们最终得到:

default.replication.factor=2
min.insync.replicas=2
offsets.topic.replication.factor=2
transaction.state.log.replication.factor=2
Run Code Online (Sandbox Code Playgroud)

这似乎解决了问题。恕我直言,这是 AWS MSK 和默认配置的一个真正问题。他们需要自动生成默认配置并根据集群中代理的数量对其进行调整。