是否有 Google Dataflow MongoDB 源/接收器?

Fel*_*ino 1 mongodb google-cloud-platform google-cloud-dataflow

我知道 Google Dataflow 仅正式支持 Google Cloud Storage、BigQuery、Avro 文件或开箱即用的 Pub/Sub 中的文件作为数据流的 I/O。

但由于它有一个用于自定义源和接收器的 API,我想知道 MongoDB 是否有一些管道 I/O 实现?

现在,我必须将数据迁移到 BigQuery 或编写整个 Pipeline I/O 实现,然后才能知道 Google Dataflow 是否是解决我当前问题的可行解决方案。

我尝试用谷歌搜索并查看当前的 SDK 问题,但没有看到任何相关内容。我什至开始怀疑我是否错过了 Google Dataflow 概念和文档中的一些非常基本的内容,这些内容完全使使用 MongoDB 作为数据源的最初想法无效。

jkf*_*kff 5

最近, Apache Beam(正在孵化)中添加了 MongoDB 连接器。请参阅MongoDBIO