gpt4 book ai didi

caching - 将 URI 作为运行时变量传递给 mapreduce hadoop 中的分布式缓存

转载 作者:可可西里 更新时间:2023-11-01 16:32:02 24 4
gpt4 key购买 nike

我在我的 mapreduce 程序中使用分布式缓存,我将三个变量传递给这个 mapreduce 程序 input fileoutput dirconfig file.

我想添加第三个参数,即配置文件到分布式缓存。

我在 MapReduce 驱动程序的 run() 方法中设置参数如下:-

conf.set("CONF_XML", args[2]);

如何用同样的方法将这个文件添加到分布式缓存中。我该怎么做?

通常我们添加使用URI(new (file path));

DistributedCache.addCacheFile(new URI(file_path), conf); << here how to pass the argument parameter? 

最佳答案

将文件路径参数作为 URI 传递给 DistributedCache API

DistributedCache.addCacheFile(new Path(args[2]).toUri(),job.getConfiguration());

关于caching - 将 URI 作为运行时变量传递给 mapreduce hadoop 中的分布式缓存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26751102/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com