machine-learning - 在 sagemaker 中使用相同的预处理代码进行训练和推理-6ren

machine-learning - 在 sagemaker 中使用相同的预处理代码进行训练和推理

转载作者：行者123 更新时间：2023-11-30 08:47:57

24

4

我正在致力于为时间序列数据构建机器学习管道，其目标是经常重新训练和更新模型以进行预测。

我编写了一个预处理代码来处理时间序列变量并对其进行转换。

我对如何使用相同的预处理代码进行训练和推理感到困惑？我应该编写一个 lambda 函数来预处理我的数据还是有其他方法

调查来源:

aws sagemaker 团队给出的两个示例使用 AWS Glue 进行 ETL 转换。

inference_pipeline_sparkml_xgboost_abalone

inference_pipeline_sparkml_blazingtext_dbpedia

我是 aws sagemaker 的新手，正在尝试学习、理解和构建流程。如有任何帮助，我们将不胜感激!

最佳答案

以倒退的方式回答问题。

根据您的示例，下面的代码是将两个模型组合在一起的推理管道。在这里我们需要删除sparkml_model并获取我们的sklearn模型。

sm_model = PipelineModel(name=model_name, role=role, models=[sparkml_model, xgb_model])

在放置 sklearn 模型之前，我们需要 SageMaker 版本的 SKLearn 模型。

First create the SKLearn Estimator using SageMaker Python library.

sklearn_preprocessor = SKLearn(
    entry_point=script_path,
    role=role,
    train_instance_type="ml.c4.xlarge",
    sagemaker_session=sagemaker_session)

script_path - 这是包含所有预处理逻辑或转换逻辑的 python 代码。下面给出的链接中的“sklearn_abalone_featurizer.py”。

Train the SKLearn Estimator

sklearn_preprocessor.fit({'train': train_input})

Create the SageMaker model from the SKLearn Estimator that can put in inference pipeline.

sklearn_inference_model = sklearn_preprocessor.create_model()

Inference PipeLineModel creation will be modified as indicated below.

sm_model = PipelineModel(name=model_name, role=role, models=[sklearn_inference_model, xgb_model])

有关更多详细信息，请参阅以下链接。

https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/scikit_learn_inference_pipeline/Inference%20Pipeline%20with%20Scikit-learn%20and%20Linear%20Learner.ipynb

关于machine-learning - 在 sagemaker 中使用相同的预处理代码进行训练和推理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58926337/

24

4

0

文章推荐： python - TensorFlow Keras CuDNNGRU 到 GRU 转换

文章推荐： javascript - 我怎样才能确定内存被覆盖 - Javascript

amazon-sagemaker - Sagemaker 的持续培训
我正在试用亚马逊 Sagemaker ，我还没有弄清楚我们如何进行持续培训。例如，如果我在 s3 中有一个 CSV 文件，并且我想在每次更新 CSV 文件时进行训练。我知道我们可以再次访问笔记本
amazon-sagemaker - 对 SageMaker 端点的推理速率的限制
SageMaker 端点的推理率是否有限制？它是由端点后面的实例类型或实例数量以某种方式确定的吗？我尝试以 AWS Service Quotas for SageMaker 的形式查找此信息但找不
amazon-sagemaker - 亚马逊 sagemaker 中的内存错误
在预处理存储在 s3 中的 2 GB 数据时，amazon sagemaker 中发生内存错误。加载数据没有问题。数据维度为 700 万行 64 列。一种热编码也是不可能的。这样做会导致内存错误。笔
amazon-sagemaker - AWS SageMaker - 提交按钮不适用于自定义模板
当我在 AWS SageMaker 上创建一个新作业时，使用我的自定义模板和人群表单(见附件示例)提交按钮不起作用，甚至无法点击。有没有办法让这项工作？尚未看到对 AWS 支持的良好回应。 $('#s
amazon-sagemaker - Sagemaker 超参数优化 XGBoost
我正在尝试在 Amazon Sagemaker 中使用 python 构建超参数优化作业，但有些东西不起作用。这是我所拥有的: sess = sagemaker.Session() xgb = sag
amazon-sagemaker - 设备上没有剩余空间 [Amazon SageMaker]
我正在 P2.xlarge 实例中训练我的模型。当我下载数据集时，出现以下错误:“下载或提取过程中出现异常:[Errno 28] 设备上没有剩余空间”\ 我检查了 P2.xlarge 有 61GiB
amazon-sagemaker - 无法读取 Sagemaker 语义分割模型批量转换输出文件
目前我已经部署了一个语义分割模型和一个端点，我可以用它来调用和推理。现在，我一次得到每个图像的推论。现在我想使用一次尝试一批图像批量转换作业 .它工作得很好，但创建的图像是 .out 文件我
amazon-sagemaker - SageMaker Studio 凭据错误
我无法再查看项目、管道或创建新的笔记本。该投诉似乎与凭据相关。 Failed to launch app [None]. Error when retrieving credentials from
amazon-sagemaker - 创建训练作业后，如何在新数据上重新训练 sagemaker 模型
我有一个在特定数据集上训练的 sagemaker 模型，并创建了训练作业。现在我有一个新的数据集，模型必须在该数据集上进行训练，我如何根据现有模型的新数据重新训练模型？我们可以保存模型检查点吗？最佳
amazon-sagemaker - SageMaker Studio 和 EFS
我听说 Sagemaker Studio 会自动在主目录上创建 EFS。 EFS 主目录的大小是多少？是否可以调整其大小？我是 AWS 的完全初学者，所以如果有人回答我的问题，我会很高兴。最佳答
amazon-sagemaker - 更新 SageMaker Jupyterlab 环境
如何将 SageMaker 笔记本的 jupyter 环境更新到最新的 Alpha 版本，然后重新启动该过程？最佳答案您好，感谢您使用 SageMaker! 要从 SageMaker Notebo
amazon-sagemaker - 如何使用预训练模型定义 SageMaker 估算器对象，然后部署它？
我有一个预先训练好的模型，它的工件保存在 S3 存储桶中。我试图弄清楚如何定义一个查看文档的估算器:https://sagemaker.readthedocs.io/en/stable/api/tra
amazon-sagemaker - 如何保存在 Amazon SageMaker 中本地训练的模型？
我正在尝试在 SageMaker 中使用本地培训工作。遵循此 AWS 笔记本 ( https://github.com/awslabs/amazon-sagemaker-examples/blob/
amazon-sagemaker - 创建具有可配置入口点的自定义 AWS Sagemaker Estimator
我正在写一个自定义 Estimator在 AWS Sagemaker 中，对于不支持开箱即用的框架。我有自己的 docker 图像用于训练，将训练代码捆绑到图像中，这迫使我每次代码更改时都重建图像。
amazon-sagemaker - 如何使用 sagemaker java API 调用端点？
我试图运行这个例子:tensorflow_abalone_age_predictor_using_layers，其中 abalone_predictor.predict(tensor_proto) 用
python - 借助 AWS SageMaker，是否可以使用 sagemaker 开发工具包部署预训练模型？
我试图避免将现有模型训练过程迁移到 SageMaker，并避免创建自定义 Docker 容器来托管我们训练的模型。我希望将我们现有的、经过训练的模型注入(inject) AWS 通过 sagemak
python - Sagemaker : How do I set content_type in Predictor (Sagemake > 2. 0)?
请求帮助解决以下错误。 An error occurred (ModelError) when calling the InvokeEndpointoperation: Received client
amazon-sagemaker - 如何从 Amazon SageMaker 运行基于网络的 mlflow 用户界面？
我想从 Amazon SageMaker 上的笔记本中使用基于 mlflow 的用户界面。但是给定的地址http://127.0.0.1:5000似乎不起作用。我已经在 SageMaker 笔记本上
amazon-sagemaker - SageMaker Jupyter(Lab) 中的 VIM(或其他插件)安装
能否在 SageMaker 上安装 Jupyter/JupyterLab 插件？我没有在 JupyterLab 或 SageMaker 界面中看到任何添加插件的选项。希望至少安装 VIM 插件。最佳
amazon-sagemaker - AWS Sagemaker 自定义用户算法 : how to take advantage of extra instances
这是一个基本的 AWS Sagemaker 问题。当我使用 Sagemaker 的一种内置算法运行训练时，我能够通过增加训练算法的 instance_count 参数来利用将作业分配给许多实例的巨大加

首页

博学

6Ren·AI

商城

machine-learning - 在 sagemaker 中使用相同的预处理代码进行训练和推理