docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)-6ren

docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)

转载作者：行者123 更新时间：2023-12-05 02:38:59

30

4

我在谷歌的 Vertex AI 中运行自定义训练作业。执行自定义作业的简单 gcloud 命令将使用类似于以下语法的内容(可以查看命令的完整文档 here ):

gcloud beta ai custom-jobs create --region=us-central1 \
--display-name=test \
--config=config.yaml

在 config.yaml 文件中，可以指定机器和加速器 (GPU) 类型等，在我的例子中，指向位于 Google Artifact Registry 中的自定义容器执行训练代码(在 containerSpec 的 imageUri 部分指定)。示例配置文件可能如下所示:

# config.yaml
workerPoolSpecs:
  machineSpec:
    machineType: n1-highmem-2
    acceleratorType: NVIDIA_TESLA_P100
    acceleratorCount: 2
  replicaCount: 1
  containerSpec:
    imageUri: {URI_FOR_CUSTOM_CONATINER}
    args:
    - {ARGS TO PASS TO CONTAINER ENTRYPOINT COMMAND}

我们正在运行的代码需要一些运行时环境变量(需要安全)传递给容器。在API documentation对于 containerSpec，它表示可以按如下方式设置环境变量:

# config.yaml
workerPoolSpecs:
  machineSpec:
    machineType: n1-highmem-2
    acceleratorType: NVIDIA_TESLA_P100
    acceleratorCount: 2
  replicaCount: 1
  containerSpec:
    imageUri: {URI_FOR_CUSTOM_CONATINER}
    args:
    - {ARGS TO PASS TO CONTAINER ENTRYPOINT COMMAND}
    env:
    - name: SECRET_ONE
      value: $SECRET_ONE
    - name: SECRET_TWO
      value: $SECRET_TWO

当我尝试将 env 标志添加到 containerSpec 时，我收到一条错误消息，指出它不是容器规范的一部分:

ERROR: (gcloud.beta.ai.custom-jobs.create) INVALID_ARGUMENT: Invalid JSON payload received. Unknown name "env" at 'custom_job.job_spec.worker_pool_specs[0].container_spec': Cannot find field.
- '@type': type.googleapis.com/google.rpc.BadRequest
  fieldViolations:
  - description: "Invalid JSON payload received. Unknown name \"env\" at 'custom_job.job_spec.worker_pool_specs[0].container_spec':\
      \ Cannot find field."
    field: custom_job.job_spec.worker_pool_specs[0].container_spec

知道如何使用自定义容器在 Vertex AI 自定义作业中安全地设置运行时环境变量吗？

最佳答案

REST API 有两个版本 - “v1 ”和“v1beta1 ” 其中，“v1beta1”在 ContainerSpec 中没有 env 选项，但“v1”有。不带 beta 参数的 gcloud ai custom-jobs create 命令不会抛出错误，因为它使用版本“v1”进行 API 调用。

可以通过以下方式将 yaml 文件中的环境变量传递给自定义容器:

这是我用来测试需求的示例自定义培训应用程序的 docker 文件。请引用这个codelab有关培训应用程序的更多信息。

FROM gcr.io/deeplearning-platform-release/tf2-cpu.2-3
WORKDIR /root

WORKDIR /

# Copies the trainer code to the docker image.
COPY trainer /trainer


# Copies the bash script to the docker image.
COPY commands.sh /scripts/commands.sh

# Bash command to make the script file an executable
RUN ["chmod", "+x", "/scripts/commands.sh"]


# Command to execute the file
ENTRYPOINT ["/scripts/commands.sh"]

# Sets up the entry point to invoke the trainer.
# ENTRYPOINT "python" "-m" $SECRET_TWO ⇒ To use the environment variable  
# directly in the docker ENTRYPOINT. In case you are not using a bash script, 
# the trainer can be invoked directly from the docker ENTRYPOINT.

下面是docker容器中使用的commands.sh文件，用于测试环境变量是否传递给容器。

#!/bin/bash
mkdir /root/.ssh
echo $SECRET_ONE
python -m $SECRET_TWO

示例 config.yaml 文件

# config.yaml
workerPoolSpecs:
  machineSpec:
    machineType: n1-highmem-2
  replicaCount: 1
  containerSpec:
    imageUri: gcr.io/infosys-kabilan/mpg:v1
    env:
    - name: SECRET_ONE
      value: "Passing the environment variables"
    - name: SECRET_TWO
      value: "trainer.train"

下一步，我构建容器并将其推送到 Google 容器存储库。现在，可以运行 gcloud ai custom-jobs create --region=us-central1 --display-name=test --config=config.yaml 来创建自定义训练作业和输出commands.sh 文件可以在作业日志中看到，如下所示。

关于docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69302528/

30

4

0

文章推荐： c++ - 是否可以在 C++ 的循环外使用 continue 关键字？

文章推荐： firebase - 在 Firebase 9.0.0 上取消订阅的正确方法

python - 不可排序的类型 : Vertex() < Vertex()
我在使用 dijkstra 时遇到了这个错误:TypeError:不可排序的类型:Vertex() dijkstra(g, g.get_vertex('a')) File "C:/Use
具有自定义 Vertex 类的 C++ std::set 迭代器
我对为自定义类实现迭代器感到困惑。我正在尝试为 std::set 实现一个迭代器，其中我的 Vertex 类声明为: class Vertex{
java - DirectedGraph : addVertex(Vertex v), String 无法转换为 Vertex
我正在尝试学习和实现有向图，但在执行程序时遇到了一些困难。 // ADD Function public boolean addVertex(Vertex v) { boolean added
android - OpenGL ES : Bad performance when calculating vertex position in vertex shader
我是 OpenGL 的初学者，我试图每 5 秒将大量“对象”从一个位置移动到另一个位置。如果我在顶点着色器中计算位置，fps 急剧下降，难道不应该在 GPU 上完成这些类型的计算吗？这是顶点着色器代
c++ - BGL : How to get custom vertex properties class instance from vertex iterator?
我正在学习使用 Boost 图形库。我已经按照此处的说明定义了一个自定义结构来存储有关顶点的信息:Modifying vertex properties in a Boost::Graph . str
c++ - BGL : Using bundled properties to store vertex descriptor of another vertex
我正在尝试使用 boost::adjacency list 和捆绑属性创建一个 TreeMap 来存储每个顶点的父级，我想以一种它们不会失效的方式存储顶点描述符以防万一我删除了一个顶点，所以我使用了
go - 对于结构顶点，map[int]vertex 和 map[int]*vertex 有什么区别？
要定义一个从 int 到 struct vertex 的映射，我应该定义 map[int]vertex 还是 map[int]*vertex？首选哪一个？我扩展了 Chickencha 的代码: p
c++ - 将 `Vertex Buffer Object` 绑定(bind)到 `Vertex Array Objects` 后，我应该删除它吗？
我创建了一个 VBO(顶点缓冲区对象)和 VAO(顶点数组对象)并执行了以下操作: glBindVertexArray(vao); glBindBuffer(GL_ARRAY_BUFFER, vbo)
vertex - 泰坦删除顶点无法正常工作
我用 HBase 设置了 Titan。我删除图中的所有顶点全部删除后显示为空。 gremlin> g.V.count() ==>0 但是如果我重新登录泰坦，那么图中会有一堆空顶点 gremlin>
vertex-shader - 为什么这个计算着色器比顶点着色器慢得多？
我正在探索使用计算着色器将骨骼变形应用于网格顶点，而不是使用流输出的顶点着色器。我发现计算着色器的执行速度比顶点着色器慢得多，但在我把它写下来之前，我想确定我没有做错什么。使用我的 100,000
vertex - 一组顶点不相交的循环，以便每个顶点都属于一个循环
这里我有一个有向图G，我需要判断是否存在一组顶点不相交的循环，以便每个顶点都属于一个循环。我不确定这是否可以在多项式时间内完成或者它是否是 NP-Complete？谁能至少指出我正确的方向？最佳答
geometry - "ray through vertex"检测多边形中的点时的特殊情况
要检测一个点是否在多边形中，您可以从该点到无穷远投影一条线，然后查看它与多少个多边形顶点相交......足够简单。我的问题是，如果射线在其中一个点上与多边形相交，则将其视为与两个线段相交，并被视为在多
OrientDB使用 "DELETE VERTEX ..."SQL语句时不会一次删除所有顶点
我在 VehicleHistoryGraph 数据库中创建了一个 Message 类型的顶点，并向其中加载了 50,000 个该类型的顶点。当我尝试使用此 SQL 语句一次删除所有顶点时 - DEL
C++:无法为 Vertex 对象创建哈希函数
所以我正在尝试将 Graph 类作为另一个项目的一部分。顶点存储在由 unordered_map 定义的邻接表中。我正在尝试创建一个散列函数以允许我的 Vertex 类存储在此 map 中，但我不知道
c++ - 帕尔马多面体库 : Vertex Enumeration
我正在尝试使用 Parma Polyhedra 库 [1]枚举(凸)多面体的顶点，例如，我有一个由四个约束指定的矩形: Constraint_System cs; cs.insert(x >= 0);
c++ - 为什么 VERTEX 着色器中的矩阵乘法不能正常工作？
我开始了解 Visual Studio 2017 中的 OpenGL。按照 www.learnopengl.com 教程并通过了纹理检查点，转换是目前的主要问题。我使用预先获取的统一位置 ID 将我
python - Vertex AI 预定笔记本不起作用，但手动工作
有一个预定的笔记本，它使用 BigQuery 客户端和具有所有者权限的服务帐户。当我手动运行单元格时，它会更新 BQ 表。 BQ 和 Vertex AI 都有一个项目。我发现了一个类似的问题，但是
r - 如何将 "vertex sequence"的列表转换为向量
我在 R 中使用 Igraph 包，当我通过 V(graph) 访问顶点名称列表时，我得到以下结果: Vertex sequence: [1] "d66cp96igcdnt25brjeics9d11
azure - Vertex 在 ADLA 中的准备时间过长
我有一个 U-SQL 脚本，它在数据湖中存储的多个 JSON 文件上运行，当我针对单个文件运行该脚本时，一切正常，但是打开它以针对我的所有文件运行每次都会出现以下错误，并且作业永远不会超过“准备”阶段
opengl - GLSL Vertex Shader 编译无显示
我正在尝试实现 phong 阴影，但无济于事。我正在一点一点地构建着色器(这本身可能是一个问题)，但这就是我目前所处的位置。我希望它将我的结果(犹他茶壶)输出为黑色背景上的白色图像。当我从顶点着色器中

首页

博学

6Ren·AI

商城

docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)