gpt4 book ai didi

amazon-web-services - 使用 Terraform 的 EKS GPU 工作组

转载 作者:行者123 更新时间:2023-12-05 03:45:31 27 4
gpt4 key购买 nike

使用 terraform EKS module ,如何使用 GPU 节点?

EKS docs建议 GPU 支持是自动的,但有些 guides/tutorials建议用户必须安装 nvidia-device-plugin 并自行配置 AMI?

最佳答案

您需要告诉工作组使用特定的 AMI 镜像,并安装 NVIDIA 设备插件。

有一个image_id worker_groups block 的属性。

找到合适的 AMI 镜像 here ,在适合您集群的 kubernetes 版本和 AWS 区域下选择 x86 accelerated 链接。复制 AMI id,例如,对于 eu-west-2 中的 k8s 1.18,您需要 ami-027a09e5aa5a67e59 .

然后将您的 AMI id 作为 image_id 插入到您的 worker_groups 配置中,例如:

module "eks" {
worker_groups = [
{
image_id = "ami-027a09e5aa5a67e59"
}
]
}

最后,你需要install the nvidia-device-plugin ,可以使用 helm provider 在 Terraform 中执行:

resource "helm_release" "k8s-device-plugin" {
name = "k8s-device-plugin"
repository = "https://nvidia.github.io/k8s-device-plugin"
chart = "nvidia-device-plugin"
version = "0.6.0"
namespace = "kube-system"
}

您现在应该能够 run GPU pods通过请求 nvidia.com/gpu 资源类型。

关于amazon-web-services - 使用 Terraform 的 EKS GPU 工作组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65774363/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com