gpt4 book ai didi

airflow - 在没有 Apache Airflow 的情况下运行 Apache Airflow DAG

转载 作者:行者123 更新时间:2023-12-02 16:39:52 36 4
gpt4 key购买 nike

所以这是一个愚蠢的想法......

我在 Airflow 中创建了(许多)DAG...并且它有效...但是,我想以某种方式将其打包,以便我可以在不安装 Airflow 的情况下运行单个 DAG 运行;即它是独立的,所以我不需要所有的网络服务器、数据库等。

无论如何,我主要是用触发器 dag 实例化新的 DAG 运行,并且我注意到运行 Airflow 的开销显得相当高(工作人员的负载很高,基本上什么也不做,有时可能需要 10 秒的时间才能对相关任务进行排队等)。

我不太关心所有的日志记录等。

最佳答案

您可以创建一个执行 Airflow 运算符的脚本,尽管这会丢失 Airflow 提供的所有元数据。您仍然需要将 Airflow 作为 Python 包安装,但不需要运行任何网络服务器等。一个简单的示例如下所示:

from dags.my_dag import operator1, operator2, operator3

def main():
# execute pipeline
# operator1 -> operator2 -> operator3

operator1.execute(context={})
operator2.execute(context={})
operator3.execute(context={})

if __name__ == "__main__":
main()

关于airflow - 在没有 Apache Airflow 的情况下运行 Apache Airflow DAG,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48393065/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com