gpt4 book ai didi

hadoop - 如何从另一个Java程序以编程方式执行MapReduce jar?

转载 作者:行者123 更新时间:2023-12-02 21:30:44 25 4
gpt4 key购买 nike

我有MapReduce程序(DataProfiler.jar),该程序通过将表名和列名作为命令行参数来执行一些数据分析。

hadoop -jar DataProfiler.jar -D tableName=MyTable -D columnFamilyName=CF1

有没有一种方法可以将其包装在另一个Java程序中。这样我就可以对所有表执行此jar(通过连接到数据库并获取所有表和列的列表)。

谢谢!

最佳答案

我建议,您可以以一些通用的方式编写逻辑MapReduce驱动程序类,而不是从简单的Java程序中调用MapReduce jar。

我们将此类称为JobRunner。您可以定义member variables,它将保存有关您需要处理的tablecolumns的信息。然后,您可以设置MapReduce配置并开始作业。从技术上讲,您可以达到相同但略有不同的方式。我认为这比调用jar并启动MapReduce作业更好。

关于hadoop - 如何从另一个Java程序以编程方式执行MapReduce jar?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34339439/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com