KafkaStreams在读取主题时写入磁盘

Dth*_*Dth 3 java apache-kafka apache-kafka-streams

我一直在调查Kafka Streams应用程序上的磁盘写入,我将拓扑结构减少到最低限度,即:

KStream<String, JsonElement> stream = builder.stream("input-topic");
Run Code Online (Sandbox Code Playgroud)

然而,docker stats我可以观察到我的应用程序一直在向磁盘写入内容.我检查了容器,我看不到任何可疑的文件句柄.

如果我评论前面提到的那一行,这个问题就会消失,所以我得出的结论是,从一个主题中读取内容在磁盘上写一些内容,但我无法猜出是什么以及为什么.

另外,我注意到它与提交间隔设置严格相关; 增加它会使写入频率降低.每次写入大约130kB的数据.

这是预期的行为吗?

Mat*_*Sax 5

Kafka Streams将检查点文件写入本地磁盘.这些检查点文件实际上只用于有状态任务,但即使没有有状态操作也会创建(对于这种情况,检查点文件几乎为空).

这是一个已知问题,并在即将发布的1.1版本中修复:https://issues.apache.org/jira/browse/KAFKA-6499