gpt4 book ai didi

hadoop - 如何为Java hadoop设置-file选项?

转载 作者:行者123 更新时间:2023-12-02 20:13:35 25 4
gpt4 key购买 nike

如何将hadoop程序所需的文件复制到所有计算节点?我知道hadoop流的-file选项可以做到这一点。我该如何针对Java + Hadoop?

最佳答案

完全一样。

假设您使用ToolRunner / Configured / Tool模式,则在运行mapper / reduce / combiner任务时,在-files选项之后指定的文件将位于本地目录中:

public class Driver extends Configured implements Tool {
public static void main(String args[]) {
ToolRunner.run(new Driver(), args);
}

public int run(String args[]) {
Job job = new Job(getConf());
// ...
job.waitForCompletion(true);
}
}

public class MyMapper extends Mapper<K1, V1, K2, V2> {
public void setup(Context context) {
File myFile = new File("file.csv");
// do something with file
}


// ...
}

然后,您可以执行以下操作:
#> hadoop jar myJar.jar Driver -files file.csv ......

有关更多信息,请参见Javadoc的 GenericOptionsParser

关于hadoop - 如何为Java hadoop设置-file选项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10239161/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com