如何使用标点符号从状态存储中删除旧记录?(卡夫卡)

2 java apache-kafka apache-kafka-streams ktable

Ktable我使用 为主题创建了streamsBuilder.table("myTopic"),并将其具体化为状态存储,以便我可以使用交互式查询。

每小时,我都想从该状态存储(以及关联的变更日志主题)中删除其值在过去一小时内尚未更新的记录。

我相信使用标点符号可以实现这一点,但到目前为止我只使用过 DSL,因此不确定如何继续。如果有人能为我提供一个例子,我将非常感激。

谢谢,

杰克

Nic*_*egg 5

可以将处理器 API 与 DSL 混合搭配,但无法处理 KTable。您需要转换为 KStream。或者,您可以使用与状态存储交互的处理器创建新的拓扑。

您需要将该状态存储在某处 - 如何确定记录是否早于一小时。一种选择是为状态存储中的每条记录添加时间戳。

在处理器的 init 方法中,您可以调用 Schedule (puncttuate) 来迭代状态存储中的记录并删除旧记录:

context.schedule(Duration.ofMillis(everyHourInMillis), PunctuationType.WALL_CLOCK_TIME, timestamp -> {
    myStateStore.all().forEachRemaining(keyValue -> {
        if (Instant.ofEpochMilli(valueInStateStore).compareTo(olderThanAnHour) < 0) {
            myStateStore.delete(keyValue.key);
        }
    });
});
Run Code Online (Sandbox Code Playgroud)

  • 谢谢您的回答。这非常有帮助。每个处理器都必须处理一个流吗?我问这个问题是因为我只想定期从状态存储中删除旧记录,并且不想处理任何特定的流。但我见过的所有标点符号示例也通过“process”方法处理流。 (2认同)