Spark Streamming:从具有多个模式的 kafka 读取数据

Sha*_*ala 5 apache-kafka apache-spark spark-streaming apache-spark-dataset

我正在为火花流的实现而苦苦挣扎。

来自 kafka 的消息看起来像这样,但有更多的字段

{"event":"sensordata", "source":"sensors", "payload": {"actual data as a json}}
{"event":"databasedata", "mysql":"sensors", "payload": {"actual data as a json}}
{"event":"eventApi", "source":"event1", "payload": {"actual data as a json}}
{"event":"eventapi", "source":"event2", "payload": {"actual data as a json}}
Run Code Online (Sandbox Code Playgroud)

我正在尝试从 Kafka 主题(具有多个模式)读取消息。我需要阅读每条消息并查找事件和源字段并决定将其存储为数据集的位置。实际数据在字段有效负载中作为 JSON,它只是一个记录。

有人可以帮助我实施这个或任何其他替代方案吗?

在同一主题中发送具有多个模式的消息并使用它是一种好方法吗?

提前致谢,

Zha*_*ong 0

JavaBean如果您只关心某些列,则将 JsonString 转换为