google-cloud-platform - 向 Google Cloud ML 提交训练作业-6ren

google-cloud-platform - 向 Google Cloud ML 提交训练作业

转载作者：行者123 更新时间：2023-12-02 15:16:30

26

4

我有如下代码，我想将其提交到 Google cloud ml。我已经测试了他们的示例并得到了结果。

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import tensorflow as tf
import numpy as np

# Data sets
I_TRAINING = "/home/android/Desktop/training.csv"
I_TEST = "/home/android/Desktop/test.csv"

# Load datasets.
training_set = tf.contrib.learn.datasets.base.load_csv(filename=I_TRAINING, target_dtype=np.int)
test_set = tf.contrib.learn.datasets.base.load_csv(filename=I_TEST, target_dtype=np.int)

# Specify that all features have real-value data
feature_columns = [tf.contrib.layers.real_valued_column("", dimension=2)]

# Build 3 layer DNN with 10, 20, 10 units respectively.
classifier = tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
                                            hidden_units=[10, 20, 10],
                                            n_classes=2,
                                            model_dir="/tmp/my_model")

# Fit model.
classifier.fit(x=training_set.data, y=training_set.target, steps=2000)

# Evaluate accuracy.
accuracy_score = classifier.evaluate(x=test_set.data, y=test_set.target)["accuracy"]
print('Accuracy: {0:f}'.format(accuracy_score))

# Classify two new flower samples.
#new_samples = np.array(
 #   [[6.4, 3.2, 4.5, 1.5], [5.8, 3.1, 5.0, 1.7]], dtype=float)
#y = classifier.predict(new_samples)
#print('Predictions: {}'.format(str(y)))

这是在 tensorflow 中训练和创建 DNN 模型的代码。我已经在本地进行了测试并收到了结果。我将此代码与 init.py 文件一起放在名为 trainer 的文件夹中，并将该文件夹上传到 gs://bucket-ml/second_job/trainer。 Second_job 是 JOB_NAME。

然后，当我想将其作为作业提交时，我执行此操作并收到以下错误:

gcloud beta ml jobs submit training ${JOB_NAME}  \ 
--package-path=trainer   \
--module-name=trainer.trainer   \
--staging-bucket="${TRAIN_BUCKET}"   \
--region=us-central1   \
--train_dir="${TRAIN_PATH}/train"

ERROR: (gcloud.beta.ml.jobs.submit.training) 
    Packaging of user python code failed with message:
      running sdist
running egg_info
creating trainer.egg-info
writing trainer.egg-info/PKG-INFO
writing top-level names to trainer.egg-info/top_level.txt
writing dependency_links to trainer.egg-info/dependency_links.txt
writing manifest file 'trainer.egg-info/SOURCES.txt'
error: package directory 'trainer' does not exist
    Try manually writing a setup.py file at your package root
    and rerunning the command

我不确定包路径和模块名称是否正确。请告诉我该怎么做。谢谢问候，

最佳答案

gcloud 命令的 --package-path 参数应指向有效 Python 包的目录，即包含 __init__.py 的目录文件(通常是空文件)。请注意，它应该是本地目录，而不是 GCS 上的目录。

--module 参数将是该包中有效 Python 模块的完全限定名称。您可以根据需要组织目录，但为了保持一致性，所有示例都有一个名为 trainer 的 Python 包，以及要运行的名为 task.py 的模块。

示例的目录结构如下所示:

trainer/
  __init__.py
  task.py

__init__.py 可能是一个空文件。 task.py 包含您的代码。然后您可以按如下方式提交您的作业:

gcloud beta ml jobs submit training ${JOB_NAME}  \ 
  --package-path=trainer   \
  --module-name=trainer.task   \
  --staging-bucket="${TRAIN_BUCKET}"   \
  --region=us-central1   \
  -- \
  --train_dir="${TRAIN_PATH}/train"

您可以为软件包和模块选择任何名称，只需确保磁盘上的名称与 gcloud 参数匹配即可:顶级目录是 --package-path ，文件是要运行的代码是 --module (不带 .py 后缀)。

一些注意事项:

注意额外的“--\”。这表明所有以下参数都应传递给您的程序。也就是说，--train_dir 不是 gcloud beta ml jobs 提交训练的参数，并将作为标志传递给您的程序
如果您打算使用 train_dir，则需要在代码中添加一些标志解析，例如使用 argparse。
您在云端阅读的文件需要位于 GCS 上。
虽然标志解析为您提供了更大的灵 active ，但这不是必需的。您可以将路径硬编码到文件名。只需确保它们指向 GCS 上的对象(然后从 gcloud 调用中删除 --train_dir)

关于google-cloud-platform - 向 Google Cloud ML 提交训练作业，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40281299/

26

4

0

文章推荐： sml - 使用 'compare' 函数比较字符串

文章推荐： grails - 如何在Spring Security Rest中自定义登录的响应

文章推荐： grails - GORM notIn带有别名的子查询

google-cloud-platform - 从 Google Cloud 上的 Cloud Run 访问 Cloud SQL
我有一个 Cloud Run 服务，它通过 SQLAlchemy 访问 Cloud SQL 实例.但是，在 Cloud Run 的日志中，我看到 CloudSQL connection failed.
cloud - 为什么叫 "Cloud"？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 4年前关闭。 Improve t
google-cloud-platform - 如何为 Cloud Build 用于 Cloud Run 部署的 Cloud Storage 存储分区指定区域？
在将 docker 容器镜像部署到 Cloud Run 时，我可以选择一个区域，这很好。 Cloud Run 将构建委托(delegate)给 Cloud Build，后者显然会创建两个存储桶来实现这
google-cloud-platform - Cloud PubSub 重复消息触发的 Cloud Functions
我正在尝试将 Cloud Functions 用作由 PubSub 触发的异步后台工作程序，并进行更长时间的工作(以分钟为单位)。完整代码在这里https://github.com/zdenulo/c
user-data - cloud-init执行顺序不尊重/etc/cloud/cloud.cfg？
这是/etc/cloud/cloud.cfg的内容Ubuntu云16.04镜像: # The top level settings are used as module # and system co
google-cloud-platform - 从 Cloud Functions 启动 Cloud Dataflow
如何从 Google Cloud Function 启动 Cloud Dataflow 作业?我想使用 Google Cloud Functions 作为启用跨服务组合的机制。最佳答案我已经包含了
google-cloud-platform - 如何从 Cloud Shell 连接到 Cloud SQL？
我想使用 Cloud Shell 在我的第二代 Cloud Sql 实例上运行数据库迁移。我找到了一个 example in the docs关于如何使用 gcloud 进行连接.但是当我运行命令时
google-cloud-platform - Cloud Dataproc 和其他 Google Cloud 产品的身份验证错误
我正在尝试使用 Google Cloud PubSub和我的 Google Cloud Dataproc群集，我收到如下身份验证范围错误: { "code" : 403, "errors" :
google-cloud-platform - 使用用户帐户凭据访问私有(private) Cloud Run/Cloud Functions
这是我的用例。我已经有一个以私有(private)模式部署的 Cloud Run 服务。 (与云功能相同的问题) 我正在开发使用此 Cloud Run 的新服务。我在应用程序中使用默认凭据进行身份验
google-cloud-sql - 如何从 Cloud Run 安全地连接到 Cloud SQL？
如何连接到 Cloud SQL 上的数据库，而无需在容器中添加我的凭据文件？最佳答案使用 UNIX 域套接字 (Java) 从云运行(完全托管)连接到云 SQL At this time Clou
google-cloud-ml - 如何在google-cloud-ml作业或Google Cloud Storage中加载numpy npz文件？
我有一个google-cloud-ml作业，需要从gs存储桶加载numpy .npz文件。我遵循了this example上关于如何从gs加载.npy文件的操作，但是由于.npz文件已压缩，因此它对我
google-cloud-platform - Cloud build trigger 看不到另一个项目的 Cloud Source Repository
我想创建链接到另一个项目中的 Cloud Source Repository 的 Cloud Build 触发器。但是当我在应该选择存储库的步骤中时，列表是空的。我尝试了不同的许可，但没有运气。谁能告
google-cloud-functions - 从 Cloud Function 本身获取 Cloud Function 名称
向 Twilio 发送 SMS 时，Twilio 会向指定的 URL 发送多个请求，以通过 Webhook 提供该 SMS 传送的状态。我想让这个回调异步，所以我开发了一个 Cloud Functio
google-cloud-firestore - 将 Cloud Firestore 项目迁移到另一个 Cloud Firestore 项目
我需要更改我的项目 ID，因为要验证的 Firebase 身份验证链接在链接上显示了项目 ID，并且由于品牌 reshape ，项目名称已更改。根据我发现的信息，更改项目 ID 似乎不太可能。我正在考
google-cloud-platform - 如何在 Cloud Run 中自动部署来自 Cloud Build 的最新镜像
用于部署我的 Angular 应用程序的 CI/CD 管道已关闭，但我看到 Google Cloud Run 在容器镜像更新后没有部署新修订版。我已将 Cloud Build 设置为在 GitHub
google-cloud-platform - 将 Cloud Armor 与 Cloud Run 结合使用并避免绕过
报价https://cloud.google.com/load-balancing/docs/https/setting-up-https-serverless#enabling While Goog
google-cloud-platform - Cloud Spanner 读取与 Cloud Spanner SQL API
Cloud Spanner 提供了两种不同的 API。 Cloud Spanner 读取与 Cloud Spanner SQL API 之间有什么区别？最佳答案在幕后，它们都使用相同的执行机制，因
google-cloud-platform - Google Cloud Spanner 和 Cloud SQL 之间有什么区别？
我是 GCP 堆栈的新手，所以我对用于存储数据的 GCP 技术数量感到非常困惑: https://cloud.google.com/products/storage 虽然上面的文章中没有提到googl
google-cloud-platform - 如何避免从 Cloud Function 到 Cloud SQL 的网络出站费用？
我发现 Google Cloud Functions 的网络出站费用令人惊讶，我正在尝试了解发生这种情况的原因以及如何避免这种情况。 Stackdriver 监控表明有问题的函数是我的 ingest
google-cloud-sql - Prisma DATABASE_URL 错误(Cloud Run + Cloud SQL)
我使用 Prisma使用 Cloud Run 和 Cloud SQL。在向 prisma.schema 提供 DATABASE_URL 后，它会在运行时抛出一个错误。 Can't reach data

首页

博学

6Ren·AI

商城

google-cloud-platform - 向 Google Cloud ML 提交训练作业