gpt4 book ai didi

apache-flink - 使用 Apache Flink,我如何按时加入 zip 两个流?

转载 作者:行者123 更新时间:2023-12-02 03:16:24 25 4
gpt4 key购买 nike

我有两个流。它们都是 1 小时窗口内的聚合数据。我想压缩这些流,以便将相同时间跨度的聚合组合在一起,如果现在存在这样的对应匹配,则可能具有空值。

DataStream<OneHourAggA> one = 
sourceA
.keyBy(d -> (String) d.values.get("m"))
.timeWindow(Time.hours(1))
.apply(new WorkWindwFolder());

DataSteam<OneHourAggB> other =
sourceB
.keyBy(d -> (String) d.values.get("m"))
.timeWindow(Time.hours(1))
.apply(new WorkWindwFolder());

DataStream<Tuple2<Option<OneHourAggA>,Option<OneHourAggB>> zipped =
sourceA.???(sourceB)

我怎样才能做到这一点?

最佳答案

您必须使用 coGroup 操作来执行聚合结果的外部联接。您将为 coGroup 操作使用相同的时间窗口规范。这是可行的,因为前一个窗口的聚合结果只会为每个窗口生成一个元素,并且该元素将获得分配的该窗口的最大时间戳。

关于apache-flink - 使用 Apache Flink,我如何按时加入 zip 两个流?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36793624/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com