gpt4 book ai didi

google-cloud-dataflow - 如何在 Dataflow 中执行联合?

转载 作者:行者123 更新时间:2023-12-03 22:15:01 30 4
gpt4 key购买 nike

我正在尝试在 Dataflow 中执行联合操作。是否有用于在 Dataflow 中合并两个 PCollections 的示例代码?

最佳答案

一个简单的方法是像这样将 Flatten() 与 RemoveDuplicates() 结合起来。根据您是想要不相交联合还是集合论联合,可以省略 RemoveDuplicates 调用:

PCollection<String> pc1 = ...;
PCollection<String> pc2 = ...;
PCollection<String> union = PCollectionList.of(pc1).and(pc2)
.apply(Flatten.<String>pCollections())
.apply(RemoveDuplicates.<String>create());

关于google-cloud-dataflow - 如何在 Dataflow 中执行联合?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28486856/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com