gpt4 book ai didi

pipeline - 我如何告诉 Dagit(Dagster GUI)在现有的 Dask 集群上运行?

转载 作者:行者123 更新时间:2023-12-02 18:49:21 27 4
gpt4 key购买 nike

我正在使用 dagster 0.11.3(撰写本文时最新版本)

我创建了一个如下所示的 Dagster 管道(另存为 pipeline.py):

@solid
def return_a(context):
return 12.34


@pipeline(
mode_defs=[
ModeDefinition(
executor_defs=[dask_executor] # Note: dask only!
)
]
)
def the_pipeline():
return_a()

我将 DAGSTER_HOME 环境变量设置为包含名为 dagster.yaml 的文件的目录,该文件是一个空文件。这应该没问题,因为根据这些文档,默认值是合理的:https://docs.dagster.io/deployment/dagster-instance .

我有一个运行在“scheduler:8786”的现有 Dask 集群。基于这些文档:https://docs.dagster.io/deployment/custom-infra/dask ,我创建了一个名为 config.yaml 的运行配置,如下所示:

execution:
dask:
config:
cluster:
existing:
address: "scheduler:8786"

我已经成功地将此运行配置与 Dagster 一起使用,如下所示:

$ dagster pipeline execute -f pipeline.py -c config.yaml

(我检查了 Dask 日志并确保它确实在我的 Dask 集群上运行)

我的问题是:如何让 Dagit 使用这个 Dask 集群?我发现的唯一似乎相关的是: https://docs.dagster.io/_apidocs/execution#executors

...但它甚至没有提到 Dask 作为一个选项(它有 dagster.in_process_executor 和 dagster.multiprocess_executor,它们似乎与 dask 完全无关)。

可能我需要配置 dagster-dask,记录在此处:https://docs.dagster.io/_apidocs/libraries/dagster-dask#dask-dagster-dask

...但是在使用 Dagit 时我应该把运行配置放在哪里?例如,无法将 config.yaml 提供给 Dagit。

最佳答案

一些选项:

鉴于上下文,我会推荐已配置 API

关于pipeline - 我如何告诉 Dagit(Dagster GUI)在现有的 Dask 集群上运行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66990345/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com