gpt4 book ai didi

scala - 如何使用scala在apache spark中存储一个 Action 的结果

转载 作者:可可西里 更新时间:2023-11-01 14:49:01 24 4
gpt4 key购买 nike

如何在 apache Spark Scala 的输出目录中存储从以下操作生成的结果:计数?

    val countval= data.map((_,"")).reduceByKey((_+_)).count

以下命令不起作用,因为计数未存储为 RDD:

    countval.saveAsTextFile("OUTPUT LOCATION")

有什么方法可以将 countval 存储到本地/hdfs 位置?

最佳答案

@szefuf 说的是正确的,在 count 之后你有一个 Long,你可以用任何你想要的方式保存它。如果您想使用 .saveAsTextFile() 将其保存为 RDD,您必须将其转换为 RDD:

 sc.parallelize(Seq(countval)).saveAsTextFile("/file/location")

SparkContext中的parallelize方法将值的集合转为RDD,所以需要先将单个值转为单元素序列。然后就可以保存了。

关于scala - 如何使用scala在apache spark中存储一个 Action 的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34412915/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com