我正在考虑将 kafka 偏移量存储在 Spark Structured Streaming 的 kafka 内部,就像它适用于 DStreams 一样stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
,与我正在寻找的相同,但适用于 Structured Streaming。它支持结构化流吗?如果是,我怎样才能实现它?
我知道使用 hdfs 检查点.option("checkpointLocation", checkpointLocation)
,但我对内置偏移管理非常感兴趣。
我期望 kafka 仅在没有 Spark hdfs 检查点的情况下存储偏移量。
apache-kafka apache-spark spark-structured-streaming spark-kafka-integration