gpt4 book ai didi

google-cloud-dataflow - Apache Beam:DoFn与PTransform

转载 作者:行者123 更新时间:2023-12-04 00:49:24 24 4
gpt4 key购买 nike

DoFnPTransform都是定义PCollection操作的方法。我们如何知道何时使用哪个?

最佳答案

理解它的一种简单方法是类似于map(f)的列表:


高阶函数map将函数应用于列表的每个元素,并返回结果的新列表。您可能将其称为计算模式。
函数f是应用于每个元素的逻辑。


现在,切换到谈论Beam的细节,我想您是在问ParDo.of(fn),它是一个PTransform


PTransform是将PCollections作为输入并产生PCollections作为输出的操作。 Beam只有PTransform的五种原始类型,封装了令人尴尬的并行计算模式。
ParDo是逐元素计算的计算模式。它有一些变体,但您不必为此担心。
DoFn,在这里我称为fn,是应用于每个元素的逻辑。


考虑这样一个事实,您可以编写一个DoFn来说明要对每个元素执行的操作,BeamRunner提供了ParDo来应用您的逻辑。

关于google-cloud-dataflow - Apache Beam:DoFn与PTransform,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47706600/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com