Kafka消费者在消息处理失败后恢复

mix*_*rmt 6 apache-kafka kafka-consumer-api

我正在我的一个项目中使用简单的kafka Consumer,我想要的逻辑是当消费者无法处理某些消息时,它将提交最后一个正确处理的消息,然后在下一次轮询时它将从失败的消息继续。

我尝试使用以下代码手动提交每条消息:

public void fetchMessages() {
  ConsumerRecords<String, MyObject> messages = kafkaConsumer.poll(10000);
  for (ConsumerRecord message : messages) {
      logger.info("Reading kafka message, topic ["+kafkaTopic+"], partition ["+message.partition()+"], offset ["+message.offset()+"]");
      try {
          MyObject myObject = (MyObject) message.value();
          logger.info("Handling message," + myObject);
          handleMessage(myObject);
          commitMessage(message);
      } catch (Exception e) {
          logger.error("Error handling message");              throw e;
      }
  }
}


private void commitMessage(ConsumerRecord message) {
        long              nextOffset        = message.offset() + 1;

        TopicPartition    topicPartition    = new TopicPartition(kafkaTopic,message.partition());
        OffsetAndMetadata offsetAndMetadata = new OffsetAndMetadata(nextOffset);

        Map<TopicPartition,OffsetAndMetadata> offsetAndMetadataMap = new HashMap<>();
        offsetAndMetadataMap.put(topicPartition,offsetAndMetadata);

        logger.info("Commiting processed kafka message, topic ["+kafkaTopic+"], partition ["+message.partition()+"], next offset ["+nextOffset+"]");
        kafkaConsumer.commitSync(offsetAndMetadataMap);
}
Run Code Online (Sandbox Code Playgroud)

但是例如,当我获取 3 条消息时,每条消息都来自不同的分区,我成功处理了第一条消息,然后无法处理第二条消息,我只是退出ConsumerRecordfor 循环,我希望得到同样的 2 条我尚未提交的消息在下一次poll迭代中。相反,消费者只是继续接收新消息,并且永远不会返回失败的消息。

还尝试应用seek失败的消息,然后退出循环,但它在 1 个分区上工作,但在许多分区上不起作用。

kafkaConsumer.seek(new TopicPartition(kafkaTopic,message.partition()),message.offset());    
Run Code Online (Sandbox Code Playgroud)

一些细节:

  • 主题有 12 个分区
  • 所有分区的一个消费者
  • 消费者在一分钟内执行一次轮询循环
  • 启用自动提交: false

我的代码或逻辑有什么问题?

mix*_*rmt 6

我发现了查找的工作原理,并且对于失败的消息,我必须查找当前消费者的所有分区的所有偏移量。

private void seekAllPartitions() {
    logger.info("Processing of some kafka message was failed, seeking all partitions to last committed");
    List<PartitionInfo> partitionInfos = kafkaConsumer.partitionsFor(kafkaTopic);
    for (PartitionInfo partitionInfo : partitionInfos) {
        TopicPartition topicPartition = new TopicPartition(kafkaTopic, partitionInfo.partition());
        OffsetAndMetadata committedForPartition = kafkaConsumer.committed(topicPartition);
        if (committedForPartition != null) {
            kafkaConsumer.seek(topicPartition,committedForPartition.offset());
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

当某些分区上的某些消费者组的最后一个偏移量尚未设置时(未知),需要对 CommitForPartition 进行空检查