gpt4 book ai didi

Hadoop 配置 : mapred. * 与 mapreduce.*

转载 作者:可可西里 更新时间:2023-11-01 14:13:58 27 4
gpt4 key购买 nike

我注意到有两组 Hadoop 配置参数:一组带有 mapred.*,另一组带有 mapreduce.。我猜这些可能是由于旧 API 与新 API 造成的,但如果我没记错的话,这些似乎共存于新 API 中。我对么?如果是这样,是否有一个通用的声明什么用于 mapred. 什么用于 mapreduce.*?

最佳答案

检查 0.20.2 的源代码,只有几个 mapreduce.* 属性,它们围绕配置作业输入/输出格式、mapper/combiner/reducer 和 partitioner 类(它们还向作业客户端发出用户正在使用新 API 的信号 - 查看 o.a.h.mapreduce.JobsetUseNewAPI() 方法的源代码)

  • mapreduce.inputformat.class
  • mapreduce.outputformat.class
  • mapreduce.partitioner.class
  • mapreduce.map.class
  • mapreduce.combine.class
  • mapreduce.reduce.class

还有一些属性,但它们是次要配置

输入和输出格式,无论是新的还是旧的 API 版本,通常使用 mapred.* 属性

例如,表示您的 map 减少了您使用 mapred.input.dir 的输入路径(无论您使用的是新 API 还是旧 API)。输出属性相同 mapred.output.dir

所以 if 的长短在于,如果没有实用方法来配置属性 (FileInputFormat.setInputPaths(Job, String)),那么您需要检查来源

关于Hadoop 配置 : mapred. * 与 mapreduce.*,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10986633/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com