gpt4 book ai didi

java - Oozie 可以暂停工作流直到某个文件生成/存在吗?

转载 作者:可可西里 更新时间:2023-11-01 16:31:05 26 4
gpt4 key购买 nike

我正在使用 Oozie第一次发现解析规范有点困难。我正在尝试创建一个简单的工作流程,在其中我在 Hive 中运行一些查询, 然后执行 shell为了用不同的程序做一些分析,最后我想执行一个 Java通过Oozie工作.

虽然我了解如何单独执行所有这些操作,但如何设置我的工作流程以便最终 Java作业在开始之前等待生成文件?谷歌搜索,我看到了制作 Oozie 的方法工作流在开始之前等待生成数据集,但我不希望整个工作流等待,因为我只希望工作流中的一个特定操作等待输入文件生成。

输入文件会很简单 - 很可能我只会执行第二个操作,即 shell一,执行一些命令,如 touch $(date -u "+%Y-%m-%d-%H").done就在它退出之前,所以我的输入文件将是一个零字节文件,名称类似于 2015-07-20-14.done .

最佳答案

创建一个协调器,它将在给定的持续时间内在指定的 hdfs 位置查找数据集。

样本协调员

<coordinator-app name="FILE_CHECK" frequency="1440" start="2009-02-01T00:00Z" end="2009-02-07T00:00Z" timezone="UTC" xmlns="uri:oozie:coordinator:0.1">
<datasets>
<dataset name="datafile" frequency="60" initial-instance="2009-01-01T00:00Z" timezone="UTC">
<uri-template>hdfs://<URI>:<PORT>/data/feed/${YEAR}/${MONTH}/${DAY}/${HOUR}</uri-template>
</dataset>
</datasets>
<input-events>
<data-in name="coorddatafile" dataset="datafile">
<start-instance>${coord:current(-23)}</start-instance>
<end-instance>${coord:current(0)}</end-instance>
</data-in>
</input-events>
<action>
<workflow>
<app-path>hdfs://<URI>:<PORT>/workflows</app-path>
</workflow>
</action>
</coordinator-app>

关于java - Oozie 可以暂停工作流直到某个文件生成/存在吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31526870/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com