Gra*_*ray 5 transactions apache-kafka aws-msk
最近,我们开始对 Kafka 连接器与 MSK(Amazon 托管的 Kafka 服务)进行一些测试。发布记录似乎工作正常,但在启用事务时则不然。
我们的集群由 2 个使用默认 MSK 配置的代理(因为我们有 2 个区域)组成。我们正在使用以下属性创建 Java Kafka 生产者:
bootstrap.servers=x.us-east-1.amazonaws.com:9094,y.us-east-1.amazonaws.com:9094
client.id=kafkautil
max.block.ms=5000
request.timeout.ms=5000
security.protocol=SSL
transactional.id=transactions
Run Code Online (Sandbox Code Playgroud)
但是,当生产者以transactional.id启用事务的设置启动时,该initTransactions()方法会挂起:
producer = new KafkaProducer<Object, Object>(kafkaProperties);
if (kafkaProperties.containsKey(ProducerConfig.TRANSACTIONAL_ID_CONFIG)) {
// this hangs
producer.initTransactions();
}
Run Code Online (Sandbox Code Playgroud)
查看日志输出,我们看到以下流,并且似乎从未超时。
TransactionManager - Enqueuing transactional request (type=FindCoordinatorRequest,
coordinatorKey=y, coordinatorType=TRANSACTION)
TransactionManager - Request (type=FindCoordinatorRequest, coordinatorKey=y,
coordinatorType=TRANSACTION) dequeued for sending
NetworkClient - Found least loaded node z:9094 (id: -2 rack: null) connected with no
in-flight requests
Sender - Sending transactional request (type=FindCoordinatorRequest, coordinatorKey=y,
coordinatorType=TRANSACTION) to node z (id: -2 rack: null)
NetworkClient - Sending FIND_COORDINATOR {coordinator_key=y,coordinator_type=1} with
correlation id 424 to node -2
NetworkClient - Completed receive from node -2 for FIND_COORDINATOR with
correlation id 424, received {throttle_time_ms=0,error_code=15,error_message=null,
coordinator={node_id=-1,host=,port=-1}}
TransactionManager LogContext.java:129 - Received transactional response
FindCoordinatorResponse(throttleTimeMs=0, errorMessage='null',
error=COORDINATOR_NOT_AVAILABLE, node=:-1 (id: -1 rack: null)) for request
(type=FindCoordinatorRequest, coordinatorKey=xxx, coordinatorType=TRANSACTION)
Run Code Online (Sandbox Code Playgroud)
据我所知,经纪人可用,并且该属性中的每个主机bootstrap.servers均可用。如果我连接到它们中的每一个并在没有事务的情况下发布,那么它就可以工作。
知道我们缺少什么吗?
然而,当生产者使用启用事务的 transactional.id 设置启动时, initTransactions() 方法会挂起:
事实证明,默认 AWS MSK 属性和代理数量存在问题。如果您创建的Kafka集群少于3个broker,则需要调整以下设置。
(我认为)应将以下设置设置为经纪人的数量:
| 财产 | 卡夫卡 默认值 |
AWS 默认值 |
描述 |
|---|---|---|---|
| 默认复制因子 | 1 | 3 | 自动创建主题的默认复制因子。 |
| 最小同步副本数 | 1 | 2 | 必须确认写入才能被视为成功的最小副本数 |
| 偏移量.主题.复制.因子 | 3 | 3 | 共享主题偏移量的内部主题。 |
| 事务.状态.日志.复制.因子 | 3 | 3 | 事务主题的复制因子。 |
因为我们有 2 个经纪人,所以我们最终得到:
default.replication.factor=2
min.insync.replicas=2
offsets.topic.replication.factor=2
transaction.state.log.replication.factor=2
Run Code Online (Sandbox Code Playgroud)
这似乎解决了问题。恕我直言,这是 AWS MSK 和默认配置的一个真正问题。他们需要自动生成默认配置并根据集群中代理的数量对其进行调整。
| 归档时间: |
|
| 查看次数: |
4457 次 |
| 最近记录: |