git - 如何处理大型 git 存储库？-6ren

git - 如何处理大型 git 存储库？

转载作者：IT王子更新时间：2023-10-29 00:53:59

29

4

我目前正在将 git 用于大型存储库(大约 12 GB，每个分支大小为 3 GB)。此存储库包含大量二进制文件(音频和图像)。

问题是克隆和 pull 会花费很多时间。特别是“解析增量”步骤可能会非常非常长。

解决此类问题的最佳方法是什么？

我试图删除增量压缩，因为它解释了 here在 .gitattributes 中使用 delta 选项，但它似乎没有改善克隆持续时间。

提前致谢

凯文

最佳答案

2015 年 4 月更新:Git Large File Storage (LFS) (通过 GitHub)。

它使用 git-lfs (参见 git-lfs.github.com )并使用支持它的服务器进行测试:lfs-test-server :
您只能将元数据存储在 git 存储库中，而将大文件存储在其他地方。

原始答案(2012 年)

对于变化不大的大型二进制文件，一个解决方案是将它们存储在不同的引用中(如 Nexus repository )，并且仅版本化一个文本文件，声明您需要哪个版本。
使用“工件存储库”比在 source 存储库中存储二进制元素更容易(用于比较版本和分支之间的 merge ，这对所述二进制文件没有多大用处)。

另一个更以 git 为中心的解决方案是 git-annex :

git-annex allows managing files with git, without checking the file contents into git.
While that may seem paradoxical, it is useful when dealing with files larger than git can currently easily handle, whether due to limitations in memory, time, or disk space.

但是它与 Windows 不兼容。

一个更通用的解决方案可能是 git-media ，这还允许您将 Git 用于大型媒体文件，而无需将媒体存储在 Git 本身中。

最后，最简单的解决方案是将这些二进制文件隔离在它们自己的 git submodule 中。正如您在问题中提到的:它不是很令人满意，初始克隆仍需要时间，但父存储库的下一次更新会很短。

关于git - 如何处理大型 git 存储库？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12855926/

29

4

0

文章推荐： php - 检查字符串是否为 MD5 哈希

文章推荐： mongodb - 如何将 mongodb 投影与 Go 和 mgo 一起使用？

文章推荐： git - 我如何将 "move"从 "no branch"提交到实际分支？

jackrabbit - 将数据从一个 jackrabbit 存储库(Magnolia 存储库)传输/迁移到另一个 jackrabbit 存储库
任何人都知道如何将内容从一个 Magnolia CMS 存储库(Jackrabbit 存储库)传输/迁移到我们的应用程序使用的另一个自定义 jacrabbit 存储库？最佳答案正如另一张海报所建议
git - 直接写入远程 Git 存储库，而不将对象添加到本地索引/存储库？
Git 是否支持任何允许我直接从本地/工作树提交到远程存储库的命令？正常的工作流程至少需要一个“git add”来用文件内容的副本等填充对象数据库。我知道这不是正常的、预期的 Git 工作流程。但我
git - 防止从过时的 Git 存储库 pull/推并重定向到新的 Git 存储库
我们正在将 Git 存储库移动到新服务器。迁移后我们显然可以只删除旧的存储库，所以当人们尝试推送或 pull 时他们会得到一个错误并在 wiki 上查找新的存储库 URL，但是是否有可能阻止 pull
git - 将两个独立的 SVN 存储库 merge 为一个 Git 存储库
我们有两个 Subversion 存储库，每个存储库都有一个项目。所以: svn://server/svn/project_a svn://server/svn/project_b 它们是独立的项目，
eclipse - 合并/聚合 eclipse p2 存储库/可扩展的 p2 存储库
使用 maven/tycho 构建 Nodeclipse Eclipse 插件每个版本都有新的 p2 存储库。发布是在 Bintray 上完成的不允许更新文件。所以每个版本都在它的文件夹中。 Bas
mercurial - 如何将 mercurial 存储库(包括历史记录)作为子目录导入另一个 mercurial 存储库，而不使用子存储库？
这听起来有点复杂，让我解释一下: Project_A 在它自己的 Mercurial 存储库中已经存在了一段时间。 Project_A 现在被 merge 到一个新的 super 项目 Super-P
mercurial - 如何将一个 Mercurial 存储库(包括历史记录)作为子目录导入另一个 Mercurial 存储库，而不使用子存储库？
这听起来有点复杂，所以让我解释一下: Project_A 已在其自己的 Mercurial 存储库中存在了一段时间。 Project_A 现在正在 merge 到一个新的 super 项目 Super
git - 将 Git 存储库 A 移动到具有完整历史记录的 Git 存储库 B(非空)
我想将我的所有文件从 Git Repo A 移动到 Git Repo B 并具有完整的历史记录。 Git B 已经包含另一个项目文件。我尝试了几种方法，例如 How to move files fro
git - 如何 pull 一个原始的 git 存储库，其来源是 github 存储库？
我从 github 中托管的公共(public) git 存储库创建了一个裸存储库 (MY_LOCAL_REP): ~$ git clone --bare github 存储库已更新(创建了一个分支
git - 从 svn 存储库克隆 git 存储库，导致无文件、无远程分支的 git 存储库
工作 SVN 库我正在启动一个 git 存储库来与 svn 存储库进行交互。 svn 存储库已设置并且工作正常，其中包含一个基本 README 文件的单次提交。检查它工作正常: tchalvak:
spring-boot - spring boot 数据 redis 存储库 @Id 注释 vs jpa 存储库 @Id
我正在使用 spring boot 1.5.2 和 spring boot data redis 1.8。我有两个@Id 注解，一个用于JPA，另一个用于redis hash。这里我想使用 JPA
Maven 存储库
我是 maven 的新手。我仍然无法理解它的概念。例如，我正在寻找 com.extjs:gxt:jar:2.2.5 或 org.syslog4j:syslog4j:jar:0.9.46。我在任何 r
存储库、服务层和方法放置
我已经阅读了很多关于存储库模式和服务层的作用的书，我(我认为)很清楚这两者之间的区别。但是现在有一个简单的问题让我挠头了一段时间。我知道数据访问层如何负责...访问数据，因此典型的存储库可能具有插入
git - 如何导入旧设置/存储库
我是 Git/Smartgit 的新手。现在我不得不在 WIN 10 下配置一台新 PC。请问我如何将设置和存储库从旧 PC 导出/导入到新 PC？非常感谢，问候，本德最佳答案 SmartGit
其他存储库中的 Laravel 存储库
所以我最近开始在我的工作项目中使用存储库模式。我一直遇到同样的问题，我似乎无法找到答案: 可以将另一个存储库注入(inject)现有存储库吗？这样做有什么负面影响？例如 : class Crawls
Azure应用程序服务未将Gitlab容器注册表配置选择为私有(private)存储库
我有一个应用程序容器推送到 gitlab 容器注册表。我正在尝试将其作为容器部署到 azure web 应用程序服务中。我根据azure的文档尽我所能地进行了配置。但我不明白我错过了什么，因为 azu
java - 无法通过代理连接到互联网/存储库
我使用java框架来开发crud应用程序。这个框架被称为:“Cuba.Platform”。我的问题是，我无法在古巴打开该项目。当我尝试在那里打开我的项目时，我遇到了这个问题: “存储库包含 http
C# WCF 存储库
我在我的数据层中有几个对数据库执行 CRUD 操作的存储库类。我不确定这种设计，因为大多数表都需要每个存储库一个专用类，一段时间后我最终会为数据库中存在的每个表得到很多存储库。我这样做是因为，当然，我
C# 存储库 - 如何与其他存储库交互
我正在重构一些代码，并将一些执行数据库 CRUD 操作的方法提取到它们自己的存储库类中。我有几个问题，鉴于以下两种类型的对象存储在数据库中:用户和角色我应该创建 IUserRepository 和
c# - 存储库/服务层设计模式的建议
尝试在这里创建一个非常简单的存储库和服务层模式。 (.NET 4、C#、LINQ，尽管这个问题部分与语言无关)。注意:这只是研发。我的目标是尽量减少服务层中方法定义的数量。这是我的存储合约: in

首页

博学

6Ren·AI

商城

git - 如何处理大型 git 存储库？