PUG*_*PUG 3 google-cloud-dataflow apache-beam
我有一个用例,需要T从DoFn 输出多个。所以DoFn函数返回一个PCollection<List<T>>。我想将其转换为PCollection<T>以便稍后在管道中进行过滤,例如:
PCollection<T> filteredT = filterationResult.apply(Filter.byPredicate(p -> p.equals(T) == T));
Run Code Online (Sandbox Code Playgroud)
目前,我能想到的最好的方法是,List<T>从ParDo我KV<String,List<T>>用相同键返回的函数返回每个项目。然后在管道中,我可以执行以下操作以合并结果:
filterationResult.apply("Group", GroupByKey.<String, List<T>>create())
Run Code Online (Sandbox Code Playgroud)
或者可以拨打我c.output(T)从DOFN(这里c是ProcessContext对象传入)多次?
| 归档时间: |
|
| 查看次数: |
1886 次 |
| 最近记录: |