gpt4 book ai didi

Hadoop 映射/减少链接

转载 作者:可可西里 更新时间:2023-11-01 14:23:39 24 4
gpt4 key购买 nike

我想链接 2 个 Map/Reduce 作业。我正在尝试使用 JobControl 来实现相同的目的。我的问题是 -

JobControl 需要 org.apache.hadoop.mapred.jobcontrol.Job,而后者又需要 org.apache.hadoop.mapred.JobConf,后者已被弃用。我如何解决这个问题以链接我的 Map/Reduce?

任何人都有更好的链接想法(除了级联)。

最佳答案

你可以使用 Riffle ,它允许您将任意进程链接在一起(任何您将其注释贴在上面的东西)。

它有一个基本的依赖调度器,所以它会为你安排和执行你的工作。它是 Apache 许可的。它也在 Conjars repo 上如果您是 Maven 用户。

我是作者,编写它是为了让 Mahout 和其他自定义应用程序能够拥有一个也与级联流兼容的通用工具。

我也是 Cascading 的作者.但是 MapReduceFlow + Cascade in Cascading 对于大多数原始 MR 作业链来说效果很好。

关于Hadoop 映射/减少链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4170060/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com