gpt4 book ai didi

trains - 使用 Trains 跟踪单独的训练/测试过程

转载 作者:行者123 更新时间:2023-12-04 09:40:56 26 4
gpt4 key购买 nike

在我的设置中,我运行了一个脚本 火车一个模型并开始生成检查点。另一个脚本监视新的检查点和 评估 他们。脚本并行运行,因此评估只是训练之后的一步。

支持这种情况的正确 Tracks 配置是什么?

最佳答案

免责声明:我是 allegro.ai Trains 的一部分团队
你有两个实验吗?一个用于测试 一个用于训练?
如果您确实有两个实验,那么我会确保模型都登录到它们中(如果它们存储在同一个共享文件夹/s3/etc 中将是自动的)
然后你就可以快速的看到每一个的表现了。
另一种选择是共享相同的实验,然后第二个过程将报告添加到原始实验中,这意味着您必须以某种方式将实验 id 传递给它。
然后你可以这样做:

task = Task.get_task(task_id='training_task_id`)
task.get_logger().report_scalar('title', 'loss', value=0.4, iteration=1)
编辑:
这两个进程总是一起启动,还是检查点测试是通用代码?
编辑2:
假设您有主要脚本训练模型。此实验具有唯一的任务 ID:
my_uid = Task.current_task().id
我们还假设你有办法将它传递给你的第二个进程(如果这是一个实际的子进程,它继承了 os 环境变量,所以你可以做 os.environ['MY_TASK_ID']=my_uid )
然后在评估脚本中,您可以直接向主要训练任务报告,如下所示:
train_task = Task.get_task(task_id=os.environ['MY_TASK_ID'])
train_task.get_logger().report_scalar('title', 'loss', value=0.4, iteration=1)

关于trains - 使用 Trains 跟踪单独的训练/测试过程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62332672/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com