gpt4 book ai didi

apache-spark - Spark RDD.saveAsTextFile 异步

转载 作者:行者123 更新时间:2023-12-04 04:14:12 31 4
gpt4 key购买 nike

我有一个很大的 RDD,需要花费很多时间来收集。我想通过使用 mapPartitionsWithIndex 将每个分区的内容写入一个文本文件。但这不是异步方法。

有没有人知道如何异步写出 RDD 内容?

最佳答案

所有 Spark RDD 操作都是同步的。 AsyncRDDActions 提供其中一些的异步版本,但不提供 saveAsTextFile。自己将其包装在 Future 中是微不足道的:

def saveAsync(rdd: RDD[String], path: String) = concurrent.Future {
rdd.saveAsTextFile(path)
}

关于apache-spark - Spark RDD.saveAsTextFile 异步,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38802747/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com