gpt4 book ai didi

apache-spark - spark RDD saveAsTextFile gzip

转载 作者:行者123 更新时间:2023-12-04 05:16:01 24 4
gpt4 key购买 nike

是否可以将 spark rdd 文本文件保存为 gzip?
我可以以某种方式运行它吗:combPrdGrp3.repartition(10).saveAsTextFile("Combined")并将其另存为 gzip 文件?

最佳答案


import org.apache.hadoop.io.compress.GzipCodec
combPrdGrp3.repartition(10).saveAsTextFile("Combined", classOf[GzipCodec])

或者
sc.hadoopConfiguration.setClass(FileOutputFormat.COMPRESS_CODEC, classOf[GzipCodec], classOf[CompressionCodec])

关于apache-spark - spark RDD saveAsTextFile gzip,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32231650/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com