gpt4 book ai didi

google-colaboratory - 机器学习和模型训练

转载 作者:行者123 更新时间:2023-11-30 10:00:19 24 4
gpt4 key购买 nike

我正在开展一个机器学习项目,在 Google Colab 上训练我的模型。我已经克隆了存储库,并且模型是使用 tensorflow 框架构建的。

但是,我的数据集太大。在运行模型之前,我想到了两个问题:

1) 如果我让模型过夜接受训练,最明智的方法是什么来知道我的训练已完成/剩下的时间? (任何通过电子邮件通知...或?)

2) 如果互联网连接中断会发生什么

我的 Google 搜索没有提供我可以理解的答案。如果您能帮助我解决我的疑问,我将不胜感激。

最佳答案

最多可以同时运行 2 个实例,并链接到您的 Google 帐户。继续备份你的重量,如果需要超过 12 小时就重新训练。

对于如此漫长的工作,投资 VPS 总是更好,但要回答您的问题,

  1. 打开浏览器时,Colab 上作业的最长生命周期为 12 小时。因此,定期保存模型权重是个好主意。在训练时备份权重的脚本是个好主意。

  2. 如果互联网连接中断,笔记本将运行 90 分钟,然后实例将被视为空闲并被回收。这类似于关闭浏览器。

关于google-colaboratory - 机器学习和模型训练,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59263928/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com