具有多个输出主题的 Kafka 流拓扑的并发性

Mar*_*zer 5 apache-kafka apache-kafka-streams

给定一个将消息发布到两个不同主题的 Kafka 流拓扑,是否可以保证在这两个分支中执行各个步骤的顺序,或者这些分支是否完全分离并并行执行?

例子

    KStream<..., ...> filteredStream = builder.stream("input-topic", ...).filter(...)...;

    filteredStream.mapValues(this::mapOne).to("output-topic-one", ...);
    filteredStream.flatMap(this::mapTwo).to("output-topic-two", ...);
Run Code Online (Sandbox Code Playgroud)

在此示例中,是否会在调用或消息mapOne发布到输出主题之前 执行并mapTwo发布到输出主题?换句话说,是否能保证在消息发布到output-topic- 2之前mapOne完成?

拓扑可视化

当查看拓扑描述的可视化时(参见底部;使用https://zz85.github.io/kafka-streams-viz/制作),您可以看到两个分支。但您还可以在每个气泡中看到这些数字,这也可能表明存在执行顺序(1-4,然后 5-6-7,然后 8-9)。

kafka流拓扑

拓扑描述

Topologies:
   Sub-topology: 0
    Source: KSTREAM-SOURCE-0000000000 (topics: [input-topic])
      --> KSTREAM-FILTER-0000000001
    Processor: KSTREAM-FILTER-0000000001 (stores: [])
      --> KSTREAM-FILTER-0000000002
      <-- KSTREAM-SOURCE-0000000000
    Processor: KSTREAM-FILTER-0000000002 (stores: [])
      --> KSTREAM-MAP-0000000003
      <-- KSTREAM-FILTER-0000000001
    Processor: KSTREAM-MAP-0000000003 (stores: [])
      --> KSTREAM-FILTER-0000000004
      <-- KSTREAM-FILTER-0000000002
    Processor: KSTREAM-FILTER-0000000004 (stores: [])
      --> KSTREAM-MAPVALUES-0000000005, KSTREAM-FLATMAP-0000000008
      <-- KSTREAM-MAP-0000000003
    Processor: KSTREAM-MAPVALUES-0000000005 (stores: [])
      --> KSTREAM-FILTER-0000000006
      <-- KSTREAM-FILTER-0000000004
    Processor: KSTREAM-FILTER-0000000006 (stores: [])
      --> KSTREAM-SINK-0000000007
      <-- KSTREAM-MAPVALUES-0000000005
    Processor: KSTREAM-FLATMAP-0000000008 (stores: [])
      --> KSTREAM-SINK-0000000009
      <-- KSTREAM-FILTER-0000000004
    Sink: KSTREAM-SINK-0000000007 (topic: output-topic-one)
      <-- KSTREAM-FILTER-0000000006
    Sink: KSTREAM-SINK-0000000009 (topic: output-topic-two)
      <-- KSTREAM-FLATMAP-0000000008
Run Code Online (Sandbox Code Playgroud)

nip*_*una 1

Kafka 流始终保证拓扑顺序。它总是在拓扑中传递消息,该拓扑有边和节点。这些边和节点按照您在应用程序中定义的方式添加到拓扑中。

在您的情况下,filtered stream遍历map values branch拓扑直到该路径结束(在您的情况下接收器 -> 主题一)。

然后继续flat map branch。直到沉入主题二。

使用该 ID 可以正确排序。

0000000004-> 0000000005-> 0000000006->0000000007

0000000004-> 0000000008->0000000009

有关更多信息,请浏览 Kafka 源代码内部拓扑构建器

并参考这个