gpt4 book ai didi

apache-spark - Spark RDD 谱系存储在哪里?

转载 作者:行者123 更新时间:2023-12-04 05:28:59 25 4
gpt4 key购买 nike

Spark RDD Lineage 存储在哪里?根据 RDD 的白皮书,它被持久化在内存中,但想知道它是在驱动程序端还是集群上的其他地方。

还有如何确保容错,即默认创建多少个 RDD(元数据)复制?

当我们不使用persist() 方法时,我想了解核心框架的行为。

最佳答案

RDD 谱系存在于 RDD 所在的驱动程序上。提交作业后,此信息不再相关。它是任何 RDD 的内部部分,这就是它了解 parent 的方式。

当驱动程序失败时,RDD 沿袭和整个计算都消失了。司机是……嗯……司机,没有它什么都不会发生。

关于apache-spark - Spark RDD 谱系存储在哪里?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34713793/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com