gpt4 book ai didi

hadoop - 如何使用 oozie 启动 N 次脚本 Pig?

转载 作者:可可西里 更新时间:2023-11-01 16:56:34 24 4
gpt4 key购买 nike

我需要处理大量具有特定日期的文件。我只找到一个解决方案,即每次使用不同的数据集启动 N 次作业。使用的分区基于 yyyy、mm、dd。我有一个 java 操作,它生成用于每个数据的良好分区。

我的问题是,如何创建一个循环来启动我的脚本 N 次?我今天使用 oozie 工作流。

谢谢

最佳答案

这听起来像是 coordinators 的用例.

可以声明Datasets并让 oozie 在特定数据集实例可用时自动启动工作流。

关于hadoop - 如何使用 oozie 启动 N 次脚本 Pig?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29074234/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com