KafkaStreams 如何在流聚合中指定Serdes？

Question

KafkaStreams 如何在流聚合中指定Serdes？

sta*_*tox 4 java apache-kafka apache-kafka-streams

我正在开发 Kafka 流应用程序，但在弄清楚如何使聚合工作时遇到了一些麻烦。

我有一个 KStream bankTransactions，其中键的类型String和类型的值，JsonNode所以我配置了我的应用程序的 Serdes

// Definition of the different Serdes used in the streams
final Serde<String> stringSerde = Serdes.String();
final Serde<JsonNode> jsonSerde = new JsonSerde();
final Serde<Long> longSerde = Serdes.Long();

config.put(StreamsConfig.DEFAULT_KEY_SERDE_CLASS_CONFIG, stringSerde.getClass().getName());
config.put(StreamsConfig.DEFAULT_VALUE_SERDE_CLASS_CONFIG, jsonSerde.getClass().getName());

Run Code Online (Sandbox Code Playgroud)

我想聚合 aKTable<String, Long>中的值，其中键将相同，但值Long将从我的 Json 中提取。

所以首先我写道：

KTable<String, Long> totalBalances = bankTransactions
        .groupByKey()
        .aggregate(
                () -> 0L,
                (key, transaction, balance) -> (Long)((Long)balance + transaction.get("amount").asLong()),
                Materialized.as("bank-total-balance")
        );

Run Code Online (Sandbox Code Playgroud)

我在运行时收到以下错误：

Caused by: org.apache.kafka.streams.errors.StreamsException:
A serializer (value: org.apache.kafka.connect.json.JsonSerializer) is not compatible to
the actual value type (value type: java.lang.Long).
Change the default Serdes in StreamConfig or provide correct Serdes via method parameters.

Run Code Online (Sandbox Code Playgroud)

我知道 Kafka 正在抱怨，因为我正在尝试使用默认的 Json serdes 来序列化Long. 所以从confluent 的文档中阅读我尝试了这个

KTable<String, Long> totalBalances = bankTransactions
        .groupByKey()
        .aggregate(
                () -> 0L,
                (key, transaction, balance) -> (Long)((Long)balance + transaction.get("amount").asLong()),
                Materialized.as("bank-total-balance").withValueSerde(Serdes.Long())
        );

Run Code Online (Sandbox Code Playgroud)

但是后来我在编译时遇到错误：

Error:(121, 89) java: incompatible types:
org.apache.kafka.common.serialization.Serde<java.lang.Long> cannot be converted
to org.apache.kafka.common.serialization.Serde<java.lang.Object>

Run Code Online (Sandbox Code Playgroud)

我尝试了不同的方式来编写这段代码（例如使用Serdes.long()而不是 my longSerdes，尝试参数化类型，Materialize甚至尝试将我的初始化程序和聚合器编写为 Java 7 风格的函数），但我无法弄清楚我做错了什么。

所以我的问题很简单：如何正确指定aggregate当它们不是默认 Serdes 时应该使用的 Serdes？

Answer 1

sta*_*tox 7

似乎正确的语法如下：

KTable<String, Long> totalBalances = bankTransactions
        .groupByKey()
        .aggregate(
                () -> 0L,
                (key, transaction, balance) -> (Long)((Long)balance + transaction.get("amount").asLong()),
                Materialized.<String, Long, KeyValueStore<Bytes, byte[]>>as("bank-total-balances")
                        .withKeySerde(stringSerde)
                        .withValueSerde(longSerde)
        );

Run Code Online (Sandbox Code Playgroud)

后面的三种类型Materialize.是键、值和用于具体化 KTable 的存储之一，这个不应更改。然后我们可以定义用于写入这个键值存储的 Serdes。

请注意，我从 github 上的一个随机存储库中获得了这个语法，我仍然很乐意接受一个由一些文档支持的更精确答案的答案。

归档时间：	7 年，2 月前
查看次数：	4459 次
最近记录：	4 年，6 月前