gpt4 book ai didi

java - Java Spark如何将JavaPairRDD ,HashMap >保存到文件?

转载 作者:行者123 更新时间:2023-12-02 20:39:21 25 4
gpt4 key购买 nike

经过一些复杂的聚合后,我得到了这个“JavaPairRDD<HashSet<String>, HashMap<String, Double>>” RDD,想将结果保存到文件中。我相信saveAsHadoopFile是这样做的不错的API,但是在为saveAsHadoopFile(path, keyClass, valueClass, outputFormatClass, CompressionCodec)填写参数时遇到了麻烦。有人可以帮忙吗?

最佳答案

您可以使用以下函数,稍后再将其解析为所需的结果。

rdd.saveAsTextFile ("hdfs:///complete_path_to_hdfs_file/");

但是,如果要使用saveAsHadoopFile API,则可以使用以下方法。
saveAsHadoopFile(complete_path_to_file, HashSet.class, HashMap.class, TextOutputFormat.class)

您还可以使用 HadoopOutputFormat.class作为最后一个参数

有关更多信息,您可以引用此链接
HadoopFile

关于java - Java Spark如何将JavaPairRDD <HashSet <String>,HashMap <String,Double >>保存到文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50055414/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com