gpt4 book ai didi

dvc - 仅使用 DVC 管道的存储库中的 git-ignore dvc.lock

转载 作者:行者123 更新时间:2023-12-05 03:40:32 26 4
gpt4 key购买 nike

我想在 git 存储库中使用 dvc 的管道功能。数据以其他方式管理,不应由 dvc 进行版本控制。唯一需要的功能是 dvc 在调用 dvc repro 时重现管道所需的步骤。在新系统上 check out 存储库应该会导致一个“空”存储库,其中没有存储任何管道步骤。

因此,- 如果我理解正确的话- 无需跟踪存储库中的 dvc.lock 文件。但是,将 dvc.lock 添加到 .gitginore 文件会导致错误消息:

ERROR: 'dvc.lock' is git-ignored.

有什么方法可以禁用 .gitignore 检查这个用例中的 dvc.lock 吗?

最佳答案

这绝对是可能的,因为 DVC 功能彼此松散耦合。您可以通过编写 dvc.yaml 文件来进行流水线操作,但可以通过在阶段输出 (outs field) 中使用 cache: false 来避免数据管理/版本控制。另请参阅助手 dvc stage add -O(big O--outs-no-cache 的别名)。

同样对于初始数据依赖,你可以dvc add --no-commit它们(ref)。

你确实想跟踪 dvc.lock不过在 Git 中,这样 DVC 就可以确定与每个 repo 副本或分支中的 Git 提交关联的管道的最新阶段。

您将负责将正确的数据文件/目录(匹配的 .dvc 文件和 dvc.lock)放置在 dvc reprodvc exp run 的工作区中表现得像预期的那样。 dvc checkout 无法帮助您。

关于dvc - 仅使用 DVC 管道的存储库中的 git-ignore dvc.lock,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68082912/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com