小编Ant*_*ets的帖子

Spark 结构化流 Kafka 偏移量管理

我正在考虑将 kafka 偏移量存储在 Spark Structured Streaming 的 kafka 内部,就像它适用于 DStreams 一样stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges),与我正在寻找的相同,但适用于 Structured Streaming。它支持结构化流吗?如果是,我怎样才能实现它?

我知道使用 hdfs 检查点.option("checkpointLocation", checkpointLocation),但我对内置偏移管理非常感兴趣。

我期望 kafka 仅在没有 Spark hdfs 检查点的情况下存储偏移量。

apache-kafka apache-spark spark-structured-streaming spark-kafka-integration

5
推荐指数
1
解决办法
1598
查看次数