小编Sim*_*mon的帖子

使用 Kafka Streams DSL 事件时间合并两个 Kafka 主题

我正在寻找一种根据事件时间合并两个 Kafka 主题的方法。

例如,我有两个具有以下架构的主题{event-key}:: {event-time-as-value}

topic I -  { {1 :: 12:00pm} {2 :: 12:10pm} {3 :: 14:50pm} {4 :: 15:00pm} }
topic II - { {1 :: 13:00pm} {2 :: 13:10pm} {3 :: 15:50pm} {4 :: 16:00pm} }
Run Code Online (Sandbox Code Playgroud)

预期输出应如下所示:

{ {1 :: 12:00pm} {2 :: 12:10pm} {1 :: 13:00pm} {2 :: 13:10pm} {3 :: 14:50pm} {4 :: 15:00pm} {3 :: 15:50pm} {4 :: 16:00pm} }
Run Code Online (Sandbox Code Playgroud)

有没有办法使用 Kafka Streams DSL 来做到这一点?

注意:原始主题很可能不是按事件时间排序的,这没关系。我希望算法始终选择当前位于每个主题开头的两个事件中最早的一个(与合并两个排序数组算法的工作方式相同)

apache-kafka apache-kafka-streams

5
推荐指数
1
解决办法
1131
查看次数

标签 统计

apache-kafka ×1

apache-kafka-streams ×1