小编Tar*_*arg的帖子

kafka只消费新消息

我的 Spark Streaming 工作正在消耗来自 Kafka 的数据

KafkaUtils.createStream(jssc, prop.getProperty(Config.ZOOKEEPER_QUORUM),
                        prop.getProperty(Config.KAFKA_CONSUMER_GROUP), topicMap);

Run Code Online (Sandbox Code Playgroud)

每当我重新启动我的工作时，它就会开始从最后一个偏移存储开始消耗（我假设这是因为发送处理后的数据需要花费大量时间，并且如果我更改消费者组，它会立即处理新消息）

我是 kafka 8.1.1，其中 auto.offset.reset 默认为最大，这意味着每当我重新启动 kafka 都会从我离开的位置发送数据。

我的用例要求我忽略这些数据并仅处理到达的数据。我怎样才能做到这一点？任何建议

apache-kafka apache-spark spark-streaming kafka-consumer-api

Tar*_*arg

lucky-day

1
推荐指数

1
解决办法

3385
查看次数

标签统计

apache-kafka ×1

apache-spark ×1

kafka-consumer-api ×1

spark-streaming ×1

kafka只消费新消息

标签 统计

小编Tar_arg的帖子

标签统计