dat*_*ser 12 google-cloud-dataflow apache-beam
二者DoFn
并PTransform
是定义操作的装置PCollection
.我们怎么知道何时使用?
Ken*_*les 17
理解它的一种简单方法是与map(f)
列表类比:
map
将函数应用于列表的每个元素,返回结果的新列表.你可以称之为计算模式.f
是应用于每个元素的逻辑.现在,切换到谈论Beam特定,我想你在问ParDo.of(fn)
,这是一个PTransform
.
PTransform
是一个以PCollections
输入和PCollections
输出为输出的操作.Beam只有五种原始类型PTransform
,封装了令人尴尬的并行计算模式.ParDo
是每元素计算的计算模式.它有一些变化,但你不需要担心这个问题.DoFn
,在这里我称它fn
是,被施加到每个元件的逻辑.你可能还会想到这样一个事实:你写了一个DoFn
说明如何对每个元素做什么,而Beam运行器提供了ParDo
应用你的逻辑.
归档时间: |
|
查看次数: |
1514 次 |
最近记录: |