gpt4 book ai didi

python - 如何循环实现airflow DAG

转载 作者:行者123 更新时间:2023-12-05 04:00:44 31 4
gpt4 key购买 nike

我刚开始使用 Airflow。我想在一个循环中设置一个 DAG,当前一个 DAG 完成时,下一个 DAG 开始。这是我想要实现的工作流程:

list_of_files = [......]
for file in list_of_files:
dag = DAG('pipeline', default_args=default_args, schedule_interval=None)
t1 = BashOperator('copy_this_file', ....)
t2 = BashOperator('process_this_file', ...)
t1.set_downstream(t2)

如果我运行 airflow backfill pipeline -s 2019-05-01,所有 DAG 都会同时启动。

最佳答案

DAG 不能相互依赖,它们是独立的工作流。您希望将任务配置为相互依赖。您可以拥有一个具有多个执行分支的 DAG,每个文件一个,类似这样(未测试):

dag = DAG('pipeline', ...)
list_of_files = [......]
with dag:
for file in list_of_files:
t1 = BashOperator('copy_this_file', ....)
t2 = BashOperator('process_this_file', ...)
t1.set_downstream(t2)

关于python - 如何循环实现airflow DAG,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55973680/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com