相关疑难解决方法(0)

来自CSV的分区数据因此我可以处理更大的补丁而不是单独的行

我刚刚开始使用Google Data Flow,我编写了一个简单的流程,从云存储中读取CSV文件.其中一个步骤涉及调用Web服务以丰富结果.有问题的Web服务在批量发送多个100个请求时表现更好.

在查看API时,我没有看到将PCollection的100个元素聚合到单个Par.do执行中的好方法.然后需要拆分结果以处理写入BigQuery表的流的最后一步.

不确定我是否需要使用窗口是我想要的.我看到的大多数窗口示例都更适合在给定时间段内进行计数.

google-cloud-dataflow

10
推荐指数
1
解决办法
1004
查看次数

标签 统计

google-cloud-dataflow ×1