python - 使用Azure机器学习服务训练大型模型时如何克服TrainingException？-6ren

python - 使用Azure机器学习服务训练大型模型时如何克服TrainingException？

转载作者：行者123 更新时间：2023-12-01 01:04:16

25

4

我正在训练一个大型模型，试图用于此目的 Azure Machine Learning service在 Azure 笔记本中。

因此，我创建了一个估计器来进行本地训练:

from azureml.train.estimator import Estimator

estimator = Estimator(source_directory='./source_dir',
                      compute_target='local',
                      entry_script='train.py')

(我的train.py应该从一个大的词向量文件开始加载和训练)。

当运行

时

run = experiment.submit(config=estimator)

我明白

TrainingException:

====================================================================

While attempting to take snapshot of /data/home/username/notebooks/source_dir Your total snapshot size exceeds the limit of 300.0 MB. Please see http://aka.ms/aml-largefiles on how to work with large files.

====================================================================

错误中提供的链接可能是 broken 。我的 ./source_dir 中的内容确实超过了 300 MB。
我该如何解决这个问题？

最佳答案

您可以将训练文件放在 source_dir 之外，这样它们就不会作为提交实验的一部分而上传，然后将它们单独上传到数据存储(基本上使用 Azure 存储)与您的工作空间关联)。然后您需要做的就是引用 train.py 中的训练文件。

请参阅Train model tutorial有关如何将数据上传到数据存储然后从训练文件访问它的示例。

关于python - 使用Azure机器学习服务训练大型模型时如何克服TrainingException？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55525445/

25

4

0

文章推荐： jdbc - SQL PreparedStatement 和自动提交

文章推荐： scala - scala 中的抽象类型

文章推荐： smalltalk - 如何找出对 myObject 的引用？

文章推荐： filter - 从与服务相同的目录提供静态内容 - Dropwizard

marketo - 克服 Marketo 的配额限制
据我所知，Marketo 将 REST API 请求的数量限制为每天 10,000 次。有没有办法克服这个限制？我可以支付并获得更多吗？我发现 REST API 请求和 SOAP API 请求是分开
linq - NHibernate 克服 NotSupportedException
有谁知道有什么方法可以克服 NotSupportedException？我有一个针对用户的方法: public virtual bool IsAbove(User otherUser) {
mapreduce - 克服 Couchbase 中的查询限制
我们最近从关系型 (MySQL) 转向 NoSQL (couchbase)。基本上它是社交手机游戏的后端。我们在扩展后端以处理越来越多的用户时面临着很多问题。当使用 MySQL 时，由于多个表之间存在
excel - 克服 VBA 输入框字符限制
我当前用来收集文本的函数 InputBox 显然不能接受超过 255 个字符，并且我需要能够收集更多字符？我可以使用参数或不同的函数来增加此限制吗？最佳答案说句迂腐的话，输入框允许您输入最多 25
string - 克服 Bitap 算法的搜索模式长度
我是近似字符串匹配领域的新手。我正在探索 Bitap algorithm 的用途，但到目前为止，它有限的模式长度让我很困扰。我正在使用 Flash，处理 32 位无符号整数和一个 IEEE-754
php - 克服 PHP 中的针状大海捞针困惑
克服 PHP 中的大海捞针困惑的最实用方法是什么？这里 $needle 是第一个参数 bool in_array ( mixed $needle , array $haystack [, bool
java - 克服 Java 中的类型删除
我有一个无法更改的客户端类。 List list1= Arrays.asList(1,2,3); System.out.println("Total sum is:"+sum(list1)); pri
java - 克服 super 上的重复方法静态引用
我们都知道，在 Java 中，如果在 Abstract 类中声明一个 static 方法，该方法将属于 Abstract 类，而不是它的 child 。 (没有抽象静态) 我有一个简单的数据库系统，它
sql - 克服 SQL 查询中的模糊字段错误
我有 4 个表和这个查询 SELECT tag.id, title FROM tag LEFT JOIN tag_map ON ( tag.id = tag_map.tag_id ) LEFT JOI
sql - 克服 SQL 查询中的不明确字段错误
我有 4 个表和这个查询 SELECT tag.id, title FROM tag LEFT JOIN tag_map ON ( tag.id = tag_map.tag_id ) LEFT JOI
arrays - 克服 Swift 中的结构实现
在 Swift 中，一切都以结构而不是类的形式实现。正在传入值，但内存地址不存储它们。这是一个例子: import UIKit var array = Array() array = [6,2,9,1
c++ - 克服 C++ 中错误的内存分配
在我编写的 C++ 程序中: #include #include using namespace std; int main() { vector a; a.resize(1); f
php_ldap 克服 ssl 困难
我正在尝试使用 php_ldap(使用 ADLdap)从 Ubuntu(hardy 8.04LTS)主机绑定(bind)到 AD。在端口 389 上绑定(bind)到 ldap://myserver
android - 克服 Android 相机产生低分辨率的照片结果
这个问题在这里已经有了答案: Low picture/image quality when capture from camera (3 个答案) 关闭 5 年前。我想从相机拍照并上传到服务器，但
c++ - 克服 rpc 字节顺序转换
我想将 unsigned char[8] 分配给 uint64(c 语言)，使用 RPC 传递此值，并将 uint64 转换回具有相同字节顺序的 unsigned char[8](cpp 语言)。问题
python - 克服 Python 在实例方法方面的局限性
Python 似乎对实例方法有一些限制。无法复制实例方法。不能 pickle 实例方法。这对我来说是有问题的，因为我的工作是非常面向对象的 project我在其中引用了实例方法，并且同时使用了深
go - 克服 Go 中不允许的导入周期
我理解这个问题，根据答案 here ，但是，我真的可以使用帮助或更详细的代码解释来说明它是如何克服的。我的情况是这样的:我曾经将模型和 Controller 分开，在我的模型包中我有一个包含所有模型
scala - 克服 Akka Persistence 中对持久消息类的更改
假设我从这样的 Akka Persistence 系统开始: case class MyMessage(x: Int) class MyProcessor extends Processor {
user-interface - 克服 Windows 用户对象句柄限制
我正在寻找在构建重量级 Windows 界面时处理用户对象句柄限制的高级策略。请说明您如何使用 SWT 或直接 Windows GUI API 克服或绕过此问题。我唯一不感兴趣的是优化小部件使用的策略
r - 用 as.Date 克服 Y2K
我有一个我知道过去的日期列表，但格式为 28/MAY/13 .用它们制作日期类的最接近的方法是基本的 dates as.Date("2013-12-31")] as.Date("2013-12-3

首页

博学

6Ren·AI

商城

python - 使用Azure机器学习服务训练大型模型时如何克服TrainingException？