Beam 的强大功能来自于它先进的窗口功能,但它也有点令人困惑。
在本地测试中看到一些奇怪的地方(我使用rabbitmq作为输入源),其中消息并不总是被发送ack,并且固定的窗口并不总是关闭,我开始挖掘StackOverflow和Beam代码库。
ack
似乎对于何时设置确切的水印存在特定于源的问题:
(和别的)。此外,似乎存在与 相对的Checkpoints ( s) 的独立概念。CheckpointMarkWatermarks
Checkpoint
CheckpointMark
Watermarks
所以我认为这是一个由多部分组成的问题:
google-cloud-dataflow apache-beam
apache-beam ×1
google-cloud-dataflow ×1