gpt4 book ai didi

hadoop - 为什么 Spark 选择在 shuffle 阶段通过网络发送数据而不是写入 HDFS 上的某个位置?

转载 作者:可可西里 更新时间:2023-11-01 15:31:07 28 4
gpt4 key购买 nike

据我所知,spark 尝试通过网络将数据发送到另一个节点的内存缓冲区,如果它不适合内存则溢出到磁盘,为什么 spark 不能从任何节点可以写入的地方写入 HDFS读 ?

最佳答案

将其写入磁盘的传输速度要慢得多。最重要的是,您保证会产生在感兴趣的节点之间同步磁盘访问的开销。

关于hadoop - 为什么 Spark 选择在 shuffle 阶段通过网络发送数据而不是写入 HDFS 上的某个位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32706091/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com