卡夫卡重新平衡和听众陷阱

Jus*_*ony 12 apache-kafka rebalancing

我正在阅读Kafka:The Definitive Guide,并希望更好地理解重新平衡监听器.本书中的示例简单地使用a HashMap来维护已处理的当前偏移量,并在撤销分区时提交当前状态.我担心的是:

我在代码示例中有两个问题/问题:

使用的语言让我假设这些回调是在不同的线程上进行的.那么,在应用当前偏移量时,是否应该考虑线程安全性？此外,在提交后,当前批次是否应该取消？
它说使用commitSync确保在重新平衡进行之前提交偏移量.然而,这仅在该消费者中是同步的.有没有一种机制让协调员在收到所有订阅消费者的回复之前不会继续进行？

我重新阅读了本书中的内容，我也感到有些困惑！

该Javadoc中指出：

每当分区分配更改时，此回调将仅作为poll（long）调用的一部分在用户线程中执行。

我看了一下代码，确认再平衡监听器方法确实在拥有使用者的同一线程中被调用。
是的commitSync()，在重新平衡监听器中提交时应该使用。

为了解释原因，让我们看一下黄金路径示例。我们从一个愉快地消费并定期向协调员心跳的消费者开始。协调器有时会REBALANCE_IN_PROGRESS向心跳请求返回错误。这可能是由于新成员想要加入组，成员离开或心跳失败或正在从订阅中添加/删除新分区引起的。此时，所有消费者都需要重新加入该组。

尝试重新加入该组之前，使用者将同步执行 ConsumerRebalanceListener.onPartitionsRevoked()。侦听器返回后，消费者将向该协调器发送一个JoinRequest以重新加入该组。

就是说，我想这就是您的想法，如果您的回调花费太长时间（> session.timeout.ms）提交，则该组可能已经存在于另一代中，并且尝试将具有偏移量的分区分配给另一个成员。在这种情况下，即使提交是同步的，提交也将失败。但是通过commitSync()在侦听器中使用，可以确保使用者在完成提交之前不会重新加入该组。

归档时间：	7 年，10 月前
查看次数：	1189 次
最近记录：	7 年，10 月前

如何为junit测试实例化Mock Kafka主题？ 11

I/O中的Kafka错误java.io.EOFException:null 7

Spark Streaming 2.2.0的NoSuchMethodError.和卡夫卡0.8 6

对象 kafka 不是包 org.apache 的成员 5

使用 kafka 作为事件存储来补充事件源聚合 5

Kafka 消费者没有选择提到的 Bootstrap 服务器 5

无法通过java代码从Windows连接到远程Kafka生产者 3

kafka ktable - 通过java访问rocksdb 3

Apache Kafka:正好在0.10版本中 2

Spark 结构化流未授权访问组 2

如何测试空的JavaScript对象？ 2730

如何在Python中获取当前时间 2618

如何获得$(this)选择器的子节点？ 2182

如何在Windows上找出正在侦听端口的进程？ 2040

如何递归计算目录中的所有代码行？ 1536

什么是右值,左值,x值,glvalues和prvalues？ 1291

如何在find中排除目录.命令 1250

type()和isinstance()之间有什么区别？ 1163

我可以将多个MySQL行连接到一个字段中吗？ 1143

如何按值排序多维数组？ 1058