gpt4 book ai didi

amazon-web-services - 如何使用 Airflow 运行资源密集型任务

转载 作者:行者123 更新时间:2023-11-30 09:05:54 25 4
gpt4 key购买 nike

我们有一个长时间运行(3 小时)的模型训练任务,每 3 天运行一次,以及每天运行的较小预测管道。对于这两种情况,我们使用 Jenkins + EC2 插件来启动大型实例(工作线程)并在其上运行管道。这有两个目的:

  1. 保持管道隔离。因此每个管道都拥有一个实例的所有资源。
  2. 我们节省成本。大型实例仅运行几个小时,而不是 24/7

使用 Jenkins + EC2 插件,我不负责将代码复制到工作人员并报告执行结果。 Jenkins 在幕后做这件事。

是否有办法通过 Airflow 实现相同的行为?

最佳答案

Airflow 1.10 发布了一系列新的 AWS 集成,为您提供了在 AWS 上执行此类操作的一些选项。

https://airflow.apache.org/integration.html#aws-amazon-web-services

如果您在容器化设置中运行任务,那么听起来 ECSOperator 或 KubernetesPodOperator 可能就是您所需要的(如果您使用的是 Kubernetes)。

关于amazon-web-services - 如何使用 Airflow 运行资源密集型任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52061728/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com