gpt4 book ai didi

apache-flink - 在 Flink 中的运算符(operator)之间共享状态

转载 作者:行者123 更新时间:2023-12-04 21:08:35 26 4
gpt4 key购买 nike

我想知道在 Flink 中是否可以在运营商之间共享状态。

例如,假设我在操作符上按键进行分区,并且我需要一个分区状态 A内隔板C (出于任何原因)(图 1.a),或者我需要运算符的状态 C在下游运营商F (图 1.b)。

enter image description here

我知道可以 broadcast记录到所有分区。因此,如果您在记录中包含操作符的内部状态,则可以与下游操作符共享您的内部状态。
然而,这可能是一个昂贵的操作,而不是简单地让 op1专门索取 op2状态。

最近围绕可查询状态的发展是否朝着这个概念发展,或者它们只是为了让外部用户查询拓扑的内部状态?

预先感谢您的见解

最佳答案

一般来说,Flink 的设计不允许读取或写入相同或不同算子的其他子任务的状态。正如你所说,你可以使用 broadcast使状态全局可用。可查询状态功能用于外部用户查询。

但是,我听说有用户在运算符中利用此功能从同一作业的其他运算符获取数据。我不知道它的效果如何(稳定性和性能方面)。如果您想尝试一下,我会指向用户邮件列表进行更深入的技术讨论。

关于apache-flink - 在 Flink 中的运算符(operator)之间共享状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40015086/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com