Apache 光束写入转换写入多个文件?

Joe*_*Joe 2 java apache-beam

我正在查看Apache Beam的 wordCount 示例 ,当我尝试在本地运行此示例时,它将计数写入多个文件。我创建了一个测试项目来从文件读取和写入数据,甚至该写入操作将输出写入多个文件。如何在单个文件中获得结果?我正在使用直接转轮

de1*_*de1 5

这是出于性能原因而发生的。您应该能够使用TextIO.Write.withoutSharding强制单个文件

不分片

公共 TextIO.Write withoutSharding()

强制将单个文件作为输出和空的分片名称模板。此选项仅与无窗口写入兼容。

对于非窗口写入,限制分片的数量可能会降低管道的性能。除非您需要特定数量的输出文件,否则不建议设置此值。

这相当于 .withNumShards(1).withShardNameTemplate("")