gpt4 book ai didi

azure - 如何使用 Azure 数据工厂 (ADF) 创建 Spot 实例 - 作业集群 - 链接服务

转载 作者:行者123 更新时间:2023-12-01 23:24:58 24 4
gpt4 key购买 nike

我有一个包含 Databricks 事件的 ADF 管道。

该事件每次都会创建一个新的作业集群,并且我已将所有必需的 Spark 配置添加到相应的链接服务中。

现在,Databricks 提供了 Spot 实例,我想在 Databricks 中使用 Spot 配置创建新集群。

我尝试从 LinkedService 寻求帮助文档但没有运气!

如何使用 ADF 执行此操作?

干杯!!!

最佳答案

我找到了另一种解决方法,使 ADF Databricks 链接服务能够使用 Spot 实例创建作业集群。如Alex Ott mentioned ,Databricks 链接服务接口(interface)不支持 azure_attribute 群集属性。

相反,我最终创建了一个强制执行现货实例的集群策略:

{
"azure_attributes.availability": {
"type": "fixed",
"value": "SPOT_WITH_FALLBACK_AZURE",
"hidden": true
}
}

如果要增强 azure_attributes 对象的其他属性,可以添加到该策略。另外,请确保为适当的组/用户设置策略权限。

创建策略后,您需要检索策略 ID。我使用对 2.0/policies/clusters/list 端点的 REST 调用来获取该值。

从那里你可以做什么 Alex Ott suggested并使用动态 json 选项创建链接服务,并将具有适当策略 ID 的 policyId 属性添加到 typeProperties 对象:

"typeProperties": {
"domain": "Your Domain",
"newClusterNodeType": "@linkedService().ClusterNodeType",
"newClusterNumOfWorker": "@linkedService().NumWorkers",
"newClusterVersion": "7.3.x-scala2.12",
"newClusterInitScripts": [],
"newClusterDriverNodeType": "@linkedService().DriverNodeType",
"policyId": "Your policy id",
}

现在,当您调用 ADF 管道时,它将使用集群策略创建一个作业集群,以将 azure_attributes 的可用性属性限制为您指定的任何内容。

关于azure - 如何使用 Azure 数据工厂 (ADF) 创建 Spot 实例 - 作业集群 - 链接服务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67409830/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com