我是该项目的新手,我正在尝试在Dataflow和数据库之间创建一个连接器.
文档明确指出我应该使用Source和Sink但我看到很多人直接使用与PInput或PDone相关联的PTransform.
源/接收器API处于实验阶段(使用PTransform解释所有示例),但似乎更容易将其与自定义运行器集成(例如:spark).
如果我参考代码,则使用这两种方法.我看不到任何使用PTransform API会更有趣的用例.
Source/Sink API是否应该重新设计PTranform API?
我是否遗漏了能明确区分这两种方法的东西?
Source/Sink API是否足够稳定,被认为是编码输入和输出的好方法?
谢谢你的建议!