小编pib*_*afe的帖子

来源与PTransform

我是该项目的新手,我正在尝试在Dataflow和数据库之间创建一个连接器.

文档明确指出我应该使用Source和Sink但我看到很多人直接使用与PInput或PDone相关联的PTransform.

源/接收器API处于实验阶段(使用PTransform解释所有示例),但似乎更容易将其与自定义运行器集成(例如:spark).

如果我参考代码,则使用这两种方法.我看不到任何使用PTransform API会更有趣的用例.

Source/Sink API是否应该重新设计PTranform API?

我是否遗漏了能明确区分这两种方法的东西?

Source/Sink API是否足够稳定,被认为是编码输入和输出的好方法?

谢谢你的建议!

java google-cloud-dataflow

10
推荐指数
1
解决办法
308
查看次数

标签 统计

google-cloud-dataflow ×1

java ×1