服务器上的 Git 存储库比所有分支的本地克隆大得多-6ren

服务器上的 Git 存储库比所有分支的本地克隆大得多

转载作者：太空狗更新时间：2023-10-29 13:15:35

25

4

我们目前面临一个奇怪的情况，一个本地克隆只有 65MB 的存储库在服务器上(GitBlit，但这应该无关紧要)大小为 12 GB。我尝试了不同的想法，这里可能会出错，这是列表:

为服务器上的每个分支完成 git ls-tree -r -t -l --full-name HEAD > stats.txt，并收集该信息。
使用 cut -c53-60 <filename> | grep -v '-' | awk '{ sum += $1 } END { print sum }' 分析结果并总结所有提交的所有文件大小。
结果我们得到了 ~ 150 MB

所以我们没有发现任何包含大文件的提交。

我的本地目录 .git/objects/pack 有一个包文件，当前大小为 17MB(在 GC 之后，之前是 21MB)。服务器上的包文件目前大小为 12 GB。

我以正常方式克隆了存储库:git clone https://myserver.mycompancy.com/gitblit/r/projectID/projectID.git 并获得了本地副本。可以肯定的是，我已经完成了 git fetch --all 而没有改变。

那么我们如何才能找到服务器上的包文件大得多的原因呢？ GitBlit 有一个自动运行的 GC，它将打包超过 7 天的松散对象。

更新:我已经按照建议在我的本地克隆和服务器上执行命令 git verify-pack -v，结果如下(仅作为统计数据):

结果行
- 本地:60,156
- 服务器:16,456,844

因此服务器上的包文件长了一个数量级(约 270 倍)，这单独解释了包中的差异。下一步应该做什么来找到更多行的原因？统计数据的某些方面是否更有趣？

最佳答案

查看我的 ticket on GitHub关于这个问题。以下是我们所做工作的总结:

我们已经看到服务器存储库比客户端存储库大得多(> 270 倍)。
我们通过命令git verify-pack -v(感谢@max360)获得了关于包文件的一些细节(这就是为什么服务器仓库更大的原因)。<
单独结果文件的大小(类似于打包文件本身的大小)向我们表明索引中包含的对象要多得多。
我们不知道其中的原因，我们原以为 GitBlit 会自动减少它(它没有')，但是在 git gc --prune --agressive 之后，前 12 GB 的打包文件大小缩小到约 110 MB。

我们不知道出了什么问题导致存储库膨胀，但至少我们找到了一种再次缩小它的方法。

@James Moger 在 GitHub 票证中解释说，在 GitBlit 上执行 GC 是一项实验性功能，并且由于使用 JGit 而不是 Git 二进制文件，因此 GitBlit 执行的 GC 结果可能与 git gc 上面的命令。

关于服务器上的 Git 存储库比所有分支的本地克隆大得多，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34809571/

25

4

0

文章推荐： android - React-Native Android ReactContext 返回 null

文章推荐： Git 克隆在 Ansible 中挂起

git - 将 "git git"别名为 "git"？
我时不时地输入“git”，然后想到别的东西，然后输入例如“git checkout master”。当然，这给我留下了 $ git git checkout master git: 'git' is
git - 我怎么能再次 git clone git ://foo. git？
我做到了 git 克隆 git://foo.git 光盘富 ...编辑文件.. 现在我想重新开始。我不在乎我已经做出的任何改变，但我不想再次克隆整个巨型 foo.git，只是丢失我所有的更改。我怎
git - 在 `git format-patch` ,`git am` , `git pull` 之后在 git 历史中双重提交
我在我的电脑上开发代码，我的计算节点很少。为了让我的程序保持同步，我决定使用 git。以前，我以一种单向模式使用它来“下推”从 PC 到计算节点的更改。但是时不时遇到计算节点特有的小bug，现场修复
git - 当您在 Git 存储库中运行 `git add .git` 时会发生什么？
虽然它似乎什么也没做，但它没有给出任何警告或错误消息。有什么想法吗？最佳答案来自 Git 源的注释: /* * Read a directory tree. We currently ignor
git - 运行 "git clone git@remote.git"时如何提供用户名和密码？
我知道如何为这样的 HTTPS 请求提供用户名和密码: git clone https://username:password@remote 但我想知道如何像这样向 Remote 提供用户名和密码:
git - Git GUI、Git Bash、Git CMD 的区别
Git GUI、Git Bash 和 Git CMD 之间有什么区别？我是初学者，为了进行安装，我发现自己通常同时使用 git bash 和 git CMD 最佳答案 Git CMD 就像使用 git
git - git 中的文件索引已在 Git 中删除
有人能告诉我git中文件索引被删除是什么意思吗？这些文件在我的 VS Code 中标记为红色，但我仍然可以修改文件并将更改推送到将反射(reflect)这些更改的远程存储库。我认为这一切都是在我使用命
git - 库不会通过 git 子树添加到 git
我通过 git 子树将 GLFV 库添加到项目中，但出现此警告“看起来您的 git 安装或您的 git-subtree 安装已损坏”。还描述了几个原因，为什么这可能是: 如 git --exec-pa
git - 是否可以将子目录中的 .git 目录添加到 git？
我有需要外部 git 项目的 repo，但我不想使用子模块，因为我想在 github 上存档所有文件，所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
git - 是否可以将子目录中的 .git 目录添加到 git？
我有需要外部 git 项目的 repo，但我不想使用子模块，因为我想在 github 上存档所有文件，所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
git - git 如何处理一个 git 存储库在另一个存储库中的放置？
我一直在阅读一篇文章，作者在其中指示:在现有存储库中创建一个新存储库，并想知道这是否是他忽略的错误。稍后我会与他核实。这些是我要检查的条件: 将现有目录制作成仓库的条件，并且已经 checkin 主
git - git 是否可以跟踪 ".git"文件夹？
我确实在不同的计算机上处理相同的项目，我想知道是否有一种方法可以跟踪该 .git 文件夹，这样我就不必在所有本地文件中重新配置配置文件。我将所有工作推送到 bitbucket。最佳答案不，没
git - git 存储库 `.git` 文件夹中存储的项目文件在哪里？
这个问题在这里已经有了答案: How does git store files? (3 个答案) 关闭 9 年前。我为我的许多项目创建了一个远程存储库，所以它是我的push 的目的地。与 git
git - git (git-svn) 中文件的不完整历史记录
应该如何在 git 中查看文件内容的完整历史记录？一个文件在 git 中的历史很短，存储库通过 git-svn 同步，但在 svn 中的历史很长。 git 中的历史记录到达文件移动的位置。要查看历史
git - Git 提交修改和 Git 提交新文件之间的区别
我是confused here ... 如何对修改后的文件进行git commit，以及如何对新文件进行git commit？还有，你如何在git中单独提交文件？最佳答案 git 提交过程分为两个
git - git 过滤器分支和 git 子树之间的区别？
正在搜索 throw SO 来寻找答案。遇到这个似乎没有给出任何答案的旧线程。重新触发此线程，希望有人知道! 有人能告诉我 git subtree 和 git filter-branch 的区别吗？为
git - 如何避免在每个 Git 命令的开头键入 "git"？
我想知道是否有一种方法可以避免在每个 Git 命令的开头键入单词 git。如果有一种方法可以在打开命令提示符进入 “Git 模式” 后只使用一次 git 命令就好了。例如: git> 之后，我们键
git - git 跟踪和 git 暂存的概念
当您修改工作目录中的文件时，git 会告诉您使用“git add”暂存。当您向工作目录添加新文件时，git 会告诉您使用“git add”开始跟踪。我对这两个概念有点困惑，因为我假设跟踪文件的更改
git - 为什么 git ://works but git@ does not
为什么 git://有效 $ git clone git://github.com/schacon/grit.git Cloning into 'grit'... ... Checking conne
git - git pull 真的是 git fetch + git merge 吗？
我在以下沙箱中练习 git:https://learngitbranching.js.org/?NODEMO 我在两个单独的 session 中运行了两组命令。第一组命令顺序如下: git clone

首页

博学

6Ren·AI

商城

服务器上的 Git 存储库比所有分支的本地克隆大得多