amazon-sagemaker - aws sagemaker模型训练中是否有某种持久的本地存储？-6ren

amazon-sagemaker - aws sagemaker模型训练中是否有某种持久的本地存储？

转载作者：行者123 更新时间：2023-12-02 17:12:32

24

4

我用aws sagemaker做了一些实验，从S3下载大型数据集的时间是非常有问题的，特别是当模型仍处于开发阶段，并且你想要相对较快的某种初始反馈时

是否有某种本地存储或其他方式来加快速度？

编辑我指的是批量训练服务，它允许您以 Docker 容器的形式提交作业。

虽然此服务适用于通常运行很长时间的已验证作业(这使得下载时间不那么重要)，但仍然需要快速反馈

没有其他方法可以对您的作业与 sagemaker 基础架构(配置文件、数据文件等)进行“集成”测试
在尝试模型的不同变体时，能够相对快速地获得初始反馈非常重要

最佳答案

SageMaker 有一些不同的服务，每个服务都针对特定用例进行了优化。如果您谈论的是开发环境，您可能正在使用笔记本服务。该笔记本实例附带本地 EBS (5GB)，您可以使用它来将一些数据复制到其中并运行快速开发迭代，而无需每次都从 S3 复制数据。方法是从笔记本单元或从目录列表页面打开的终端运行 wget 或 aws s3 cp。

不过，不建议将太多数据复制到笔记本实例中，因为这会导致您的训练和实验花费太长时间。相反，您应该利用 SageMaker 的第二部分，即培训服务。一旦您对要训练的模型有了很好的了解，基于笔记本实例上小型数据集的快速迭代，您就可以将模型定义指定为在训练实例集群中并行处理较大的数据集。当您发送训练作业时，您还可以定义每个训练实例将使用多少本地存储，但您将从训练的分布式模式中受益最多。

当您想要优化训练作业时，您有几种存储选项。首先，您可以为每个集群实例定义要训练模型的 EBS 卷的大小。您可以在启动训练作业时指定它( https://docs.aws.amazon.com/sagemaker/latest/dg/API_CreateTrainingJob.html ):

...
   "ResourceConfig": { 
      "InstanceCount": number,
      "InstanceType": "string",
      "VolumeKmsKeyId": "string",
      "VolumeSizeInGB": number
   },
...

接下来，您需要决定要训练哪种模型。如果您正在训练自己的模型，您就知道这些模型如何获取数据，包括格式、压缩、来源和其他可能影响将数据加载到模型输入中的性能的因素。如果您更喜欢使用 SageMaker 的内置算法，这些算法已针对处理 protobuf RecordIO 格式进行了优化。在这里查看更多信息:https://docs.aws.amazon.com/sagemaker/latest/dg/cdf-training.html

您可以受益的另一个方面(或者如果您想以更具可扩展性和优化的方式实现您自己的模型，请学习)是 TrainingInputMode ( https://docs.aws.amazon.com/sagemaker/latest/dg/API_AlgorithmSpecification.html#SageMaker-Type-AlgorithmSpecification-TrainingInputMode ):

Type: String

Valid Values: Pipe | File

Required: Yes

您可以使用文件模式从S3读取数据文件。但是，您也可以使用Pipe模式，它提供了许多选项来以流模式处理数据。这不仅仅意味着使用 AWS Kinesis 或 Kafka 等流服务的实时数据，而且您还可以从 S3 读取数据并将其流式传输到模型，并完全避免在训练时将数据存储在本地的需要实例。

关于amazon-sagemaker - aws sagemaker模型训练中是否有某种持久的本地存储？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48319893/

24

4

0

文章推荐： browser - Safari 中选项卡上的蓝色 "Halo"

文章推荐： odoo - 使用自定义模块修改 OpenERP 的核心字段之一

文章推荐： arduino - BlackWidow和YellowJacket(Arduino)

文章推荐： wai-aria - aria 标签 - 强制屏幕阅读器读取一些文本

aws-sdk - AWS SDK 与 AWS CLI - AWS 云形成 - Terraform
对于在 AWS 云中配置基础设施，我们目前使用从 ansible 角色调用的云形成模板，但我们发现在增加基础设施的规模后，此代码在 GitHub 中变得非结构化或未模块化 Github上有意大利面条式
aws-cloudformation - AWS Cloudformation 创建 AWS Cloudwatch 事件以触发 AWS Batch
我一直在阅读documentation for AWS Cloudwatch events至trigger AWS Batch我不知道如何从 cloudwatch 事件触发 aws 批处理: 在 aw
AWS EKS aws-load-balancer-controller(AWS EKS AWS-负载平衡器控制器)
我正在尝试使用入口控制器安装我的CA证书。我正在遵循这份指南。Https://docs.aws.amazon.com/eks/latest/userguide/aws-load-balancer-co
aws-cloudformation - 如何使用 aws cloudformation 或 aws cdk 设置 aws aurora mysql 表？
如何使用 aws cloudformation 或 aws cdk 设置 aws aurora mysql 表？在我的设置中，我有一个使用 lambda 实现各种微服务的无服务器应用程序。数据库是无
typescript - aws-cdk-lib vs @aws-cdk/core, @aws-cdk/aws-iam, ... 的目的是什么？
我看到了各种使用 AWS CDK 的示例，其中一些使用 aws-cdk-lib，另一些使用 @aws-cdk/core。这些之间有什么区别，什么时候应该使用一个或另一个？最佳答案 aws-cdk-l
typescript - aws-cdk-lib vs @aws-cdk/core, @aws-cdk/aws-iam, ... 的目的是什么？
我看到了各种使用 AWS CDK 的示例，其中一些使用 aws-cdk-lib，另一些使用 @aws-cdk/core。这些之间有什么区别，什么时候应该使用一个或另一个？最佳答案 aws-cdk-l
aws-lambda - AWS Lambda 是否支持 aws-sdk v3？
我在 cdk 研讨会上建立了一个小的 lambda 函数 here .我正在用 typescript 编写 lambda 函数，通过管道进行部署，该管道创建了一个包含 lambda 函数的云形成堆栈。
aws-lambda - 如何在 AWS lambda 中使用 AWS KMS
我刚刚开始使用 AWS 服务，尤其是 AWS Lambda。有没有办法从 Lambda 代码 (Java) 中使用 AWS KMS 服务。我想使用 KMS 来解密加密的外化(从属性读取) secret
aws-cloudformation - AWS CloudFormation - AWS::ElasticLoadBalancingV2::LoadBalancer - 安全组
CFN 模板是否可以根据参数向 ALB 添加一些特定的安全组？我遇到了两个安全组添加到 ALB 的情况: ALB Type: AWS::ElasticLoadBalancingV2::LoadB
security - 一个 AWS 账户上的 AWS 安全组可以引用另一个 AWS 账户上的安全组吗？
例如，我有一个主要公司 AWS 账户，其安全组为 xxxxx。现在我有了我的个人 aws 安全组-yyyyy。这些帐户根本不相关。我可以将接受组-yyyyy 添加到组-xxxxx 中，从而允许我的
aws-lambda - AWS Lambda 的 AWS MSK 触发器 - 同一执行上下文中的多个主题
我有一个 Lambda 函数，它有多个 MSK 触发器配置 - 每个都针对不同的主题。如果 Lambda 的输入 ( MSKEvent ) 可以包含多个不同的主题，则未在官方文档中找到任何信息。官
aws-glue - 来自 AWS secret 管理器的 AWS Glue 连接
在 AWS Glue 中创建 JDBC 连接时，有什么方法可以从 AWS secret manager 获取密码而不是手动硬编码吗？最佳答案我必须在我当前的项目中这样做才能连接到 Cassandr
aws-appsync - : aws-sdk/clients/appsync and aws-appsync?有什么区别
谁能告诉我: aws-sdk/clients/appsync , 和 aws-appsync 根据文档，aws-sdk/clients/appsync使用是因为只包括 aws-sdk当我们只需要 ap
aws-amplify - 如何将现有的 AWS Amplify 后端导入本地的空 AWS Amplify 项目？
我不小心删除了我的放大前端并创建了一个新前端。如何将现有的放大后端导入新创建的放大应用项目文件夹？我按照后端标签上的步骤操作 amplify init --appId(“您的新AMPLIFY APP
aws-glue - 如何使用 AWS java SDK 使用 AWS 胶水作业自动生成脚本
我正在使用 Java Sdk 创建粘合作业。它只有两个必需的参数 Command 和 Glue 版本。但我需要使用自动脚本生成来创建工作。正如我们可以从控制台做的那样，我们添加数据源、AWS Glu
aws-lambda - 有没有办法在 AWS Glue 作业结束时触发 AWS Lambda 函数？
目前我正在使用 AWS Glue 作业将数据加载到 RedShift，但在加载之后我需要运行一些可能使用 AWS Lambda 函数的数据清理任务。有没有办法在 Glue 作业结束时触发 Lambda
aws-lambda - AWS lambda 和 AWS Lambda@EDGE 之间有什么区别？
简单的 aws lambda 和 aws lambda@edge 有什么区别？最佳答案 Lambda 根据某些触发器执行函数。 Lambda 的用例非常广泛，并且与许多 AWS 服务高度集成。您甚至
ruby-on-rails - AWS OpsWorks、AWS Beanstalk 与 AWS CloudFormation？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 个月前。社区 9
aws-cdk - 无法使用 python 使用 AWS-CDK 创建 AWS 管理的事件目录
我正在尝试使用 Python 使用 AWS-CDK 创建托管广告。以下是错误，从 JavaScriptError(resp.stack) 引发 JSIIError(resp.error)jsii.er
javascript - @aws-cdk/pipelines 和 @aws-cdk/aws-codepipeline 有什么区别？
这两个包似乎在很大程度上做同样的事情？这两个包之间的预期区别是什么，我应该使用哪个包？最佳答案 Pipelines 是较新的 --experimental-- (编辑:它不再在 Experiment

首页

博学

6Ren·AI

商城

amazon-sagemaker - aws sagemaker模型训练中是否有某种持久的本地存储？