- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我目前正在将 git 用于大型存储库(大约 12 GB,每个分支大小为 3 GB)。此存储库包含大量二进制文件(音频和图像)。
问题是克隆和 pull 会花费很多时间。特别是“解析增量”步骤可能会非常非常长。
解决此类问题的最佳方法是什么?
我试图删除增量压缩,因为它解释了 here在 .gitattributes 中使用 delta 选项,但它似乎没有改善克隆持续时间。
提前致谢
凯文
最佳答案
2015 年 4 月更新:Git Large File Storage (LFS) (通过 GitHub)。
它使用 git-lfs (参见 git-lfs.github.com )并使用支持它的服务器进行测试:lfs-test-server :
您只能将元数据存储在 git 存储库中,而将大文件存储在其他地方。
原始答案(2012 年)
对于变化不大的大型二进制文件,一个解决方案是将它们存储在不同的引用中(如 Nexus repository ),并且仅版本化一个文本文件,声明您需要哪个版本。
使用“工件存储库”比在 source 存储库中存储二进制元素更容易(用于比较版本和分支之间的 merge ,这对所述二进制文件没有多大用处)。
另一个更以 git 为中心的解决方案是 git-annex :
git-annex
allows managing files with git, without checking the file contents into git.
While that may seem paradoxical, it is useful when dealing with files larger than git can currently easily handle, whether due to limitations in memory, time, or disk space.
但是它与 Windows 不兼容。
一个更通用的解决方案可能是 git-media ,这还允许您将 Git 用于大型媒体文件,而无需将媒体存储在 Git 本身中。
最后,最简单的解决方案是将这些二进制文件隔离在它们自己的 git submodule 中。正如您在问题中提到的:它不是很令人满意,初始克隆仍需要时间,但父存储库的下一次更新会很短。
关于git - 如何处理大型 git 存储库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12855926/
任何人都知道如何将内容从一个 Magnolia CMS 存储库(Jackrabbit 存储库)传输/迁移到我们的应用程序使用的另一个自定义 jacrabbit 存储库? 最佳答案 正如另一张海报所建议
Git 是否支持任何允许我直接从本地/工作树提交到远程存储库的命令?正常的工作流程至少需要一个“git add”来用文件内容的副本等填充对象数据库。 我知道这不是正常的、预期的 Git 工作流程。但我
我们正在将 Git 存储库移动到新服务器。迁移后我们显然可以只删除旧的存储库,所以当人们尝试推送或 pull 时他们会得到一个错误并在 wiki 上查找新的存储库 URL,但是是否有可能阻止 pull
我们有两个 Subversion 存储库,每个存储库都有一个项目。所以: svn://server/svn/project_a svn://server/svn/project_b 它们是独立的项目,
使用 maven/tycho 构建 Nodeclipse Eclipse 插件每个版本都有新的 p2 存储库。 发布是在 Bintray 上完成的不允许更新文件。所以每个版本都在它的文件夹中。 Bas
这听起来有点复杂,让我解释一下: Project_A 在它自己的 Mercurial 存储库中已经存在了一段时间。 Project_A 现在被 merge 到一个新的 super 项目 Super-P
这听起来有点复杂,所以让我解释一下: Project_A 已在其自己的 Mercurial 存储库中存在了一段时间。 Project_A 现在正在 merge 到一个新的 super 项目 Super
我想将我的所有文件从 Git Repo A 移动到 Git Repo B 并具有完整的历史记录。 Git B 已经包含另一个项目文件。我尝试了几种方法,例如 How to move files fro
我从 github 中托管的公共(public) git 存储库创建了一个裸存储库 (MY_LOCAL_REP): ~$ git clone --bare github 存储库已更新(创建了一个分支
工作 SVN 库 我正在启动一个 git 存储库来与 svn 存储库进行交互。 svn 存储库已设置并且工作正常,其中包含一个基本 README 文件的单次提交。 检查它工作正常: tchalvak:
我正在使用 spring boot 1.5.2 和 spring boot data redis 1.8。 我有两个@Id 注解,一个用于JPA,另一个用于redis hash。这里我想使用 JPA
我是 maven 的新手。我仍然无法理解它的概念。 例如,我正在寻找 com.extjs:gxt:jar:2.2.5 或 org.syslog4j:syslog4j:jar:0.9.46。我在任何 r
我已经阅读了很多关于存储库模式和服务层的作用的书,我(我认为)很清楚这两者之间的区别。但是现在有一个简单的问题让我挠头了一段时间。 我知道数据访问层如何负责...访问数据,因此典型的存储库可能具有插入
我是 Git/Smartgit 的新手。现在我不得不在 WIN 10 下配置一台新 PC。请问我如何将设置和存储库从旧 PC 导出/导入到新 PC? 非常感谢,问候, 本德 最佳答案 SmartGit
所以我最近开始在我的工作项目中使用存储库模式。我一直遇到同样的问题,我似乎无法找到答案: 可以将另一个存储库注入(inject)现有存储库吗?这样做有什么负面影响? 例如 : class Crawls
我有一个应用程序容器推送到 gitlab 容器注册表。我正在尝试将其作为容器部署到 azure web 应用程序服务中。我根据azure的文档尽我所能地进行了配置。但我不明白我错过了什么,因为 azu
我使用java框架来开发crud应用程序。这个框架被称为:“Cuba.Platform”。 我的问题是,我无法在古巴打开该项目。当我尝试在那里打开我的项目时,我遇到了这个问题: “存储库包含 http
我在我的数据层中有几个对数据库执行 CRUD 操作的存储库类。我不确定这种设计,因为大多数表都需要每个存储库一个专用类,一段时间后我最终会为数据库中存在的每个表得到很多存储库。我这样做是因为,当然,我
我正在重构一些代码,并将一些执行数据库 CRUD 操作的方法提取到它们自己的存储库类中。 我有几个问题,鉴于以下两种类型的对象存储在数据库中:用户和角色 我应该创建 IUserRepository 和
尝试在这里创建一个非常简单的存储库和服务层模式。 (.NET 4、C#、LINQ,尽管这个问题部分与语言无关)。注意:这只是研发。 我的目标是尽量减少服务层中方法定义的数量。 这是我的存储合约: in
我是一名优秀的程序员,十分优秀!