小编vla*_*t3k的帖子

我正在尝试实现一种通过使用 KafkaConsumer.assign(partition)、KafkaConsumer.seek(partition, offset) 随机访问来自 Kafka 的消息的方法。然后读取一条消息的轮询。

但在这种情况下我每秒无法收到超过 500 条消息。相比之下，如果我“订阅”该分区，我每秒会收到 100,000+ 条消息。（@1000 字节消息大小）

我试过了：

在所有情况下，我得到的最小值约为 200 条消息/秒。如果我使用 2-3 个线程，则最大值为 500。但上面的操作使得“.poll()”调用花费的时间越来越长（从单线程的 3-4 毫秒到 10 个线程的 40-50 毫秒）。

我天真的 kafka 理解是消费者打开与代理的连接并发送请求以检索其日志的一小部分。虽然所有这些都会涉及一些延迟，并且检索一批消息会好得多 - 我想它会随着涉及的接收器数量的增加而扩展，但代价是增加运行消费者的虚拟机和运行代理的虚拟机。但两人都在闲置。

显然，代理端发生了一些同步，但我无法弄清楚这是否是由于我使用 Kafka 或使用 .seek 的一些固有限制所致

我希望得到一些关于我是否应该尝试其他方法的提示，或者这就是我所能得到的。

1
推荐指数

1
解决办法

1768
查看次数

小编vla_t3k的帖子