结构化流Python API

Question

在文档中，它说结构化流中的诸如 mapGroupsWithState 之类的状态操作仅在 Scala 和 Java 中受支持，但我确实需要 Python 中的状态功能。我应该怎么办？

Answer 1

如果你坚持使用 Pyspark -

这两种方法都不是很好。如果您需要最新、最好的 API 功能，我建议您立即过渡到 Scala。随着项目的进展，你会反复遇到这个问题。由于 Spark 是用 Scala 编写的，Python API 总是落后。