gpt4 book ai didi

hadoop - 运行Sort MR作业时压缩不起作用

转载 作者:行者123 更新时间:2023-12-02 21:45:43 27 4
gpt4 key购买 nike

我将hadoop-2.4.0集群配置为压缩 map 输出,并且将mapred-site.xml设置如下

<property>
<name>mapreduce.map.output.compress</name>
<value>true</value>
</property>
<property>
<name>mapreduce.map.output.compress.codec</name>
<value>org.apache.hadoop.io.compress.SnappyCodec</value>
</property>

运行InvertedIndex时,压缩有效,并且可以在“减少随机字节”中看到不同的计数器。

但是,当我运行Sort时,压缩和不压缩之间的“减少随机字节”没有区别。这意味着压缩不起作用。

好奇怪我被卡住了。你知道我在做什么错吗?

最佳答案

我认为,如果这些程序之一已在Driver类(主方法)中显式设置了属性conf.setCompressMapOutput(false);,则此设置将覆盖mapred-site.xml设置。

关于hadoop - 运行Sort MR作业时压缩不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25456862/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com