小编Ant*_*ets的帖子

Spark 结构化流 Kafka 偏移量管理

我正在考虑将 kafka 偏移量存储在 Spark Structured Streaming 的 kafka 内部，就像它适用于 DStreams 一样stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)，与我正在寻找的相同，但适用于 Structured Streaming。它支持结构化流吗？如果是，我怎样才能实现它？

我知道使用 hdfs 检查点.option("checkpointLocation", checkpointLocation)，但我对内置偏移管理非常感兴趣。

我期望 kafka 仅在没有 Spark hdfs 检查点的情况下存储偏移量。

apache-kafka apache-spark spark-structured-streaming spark-kafka-integration

Ant*_*ets

2021 01-22

5
推荐指数

1
解决办法

1598
查看次数