- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我们目前面临一个奇怪的情况,一个本地克隆只有 65MB 的存储库在服务器上(GitBlit,但这应该无关紧要)大小为 12 GB。我尝试了不同的想法,这里可能会出错,这是列表:
git ls-tree -r -t -l --full-name HEAD > stats.txt
,并收集该信息。cut -c53-60 <filename> | grep -v '-' | awk '{ sum += $1 } END { print sum }'
分析结果并总结所有提交的所有文件大小。所以我们没有发现任何包含大文件的提交。
我的本地目录 .git/objects/pack
有一个包文件,当前大小为 17MB(在 GC 之后,之前是 21MB)。服务器上的包文件目前大小为 12 GB。
我以正常方式克隆了存储库:git clone https://myserver.mycompancy.com/gitblit/r/projectID/projectID.git
并获得了本地副本。可以肯定的是,我已经完成了 git fetch --all
而没有改变。
那么我们如何才能找到服务器上的包文件大得多的原因呢? GitBlit 有一个自动运行的 GC,它将打包超过 7 天的松散对象。
更新:我已经按照建议在我的本地克隆和服务器上执行命令 git verify-pack -v
,结果如下(仅作为统计数据):
因此服务器上的包文件长了一个数量级(约 270 倍),这单独解释了包中的差异。下一步应该做什么来找到更多行的原因?统计数据的某些方面是否更有趣?
最佳答案
查看我的 ticket on GitHub关于这个问题。以下是我们所做工作的总结:
git verify-pack -v
(感谢@max360)获得了关于包文件的一些细节(这就是为什么服务器仓库更大的原因)。<git gc --prune --agressive
之后,前 12 GB 的打包文件大小缩小到约 110 MB。我们不知道出了什么问题导致存储库膨胀,但至少我们找到了一种再次缩小它的方法。
@James Moger 在 GitHub 票证中解释说,在 GitBlit 上执行 GC 是一项实验性功能,并且由于使用 JGit 而不是 Git 二进制文件,因此 GitBlit 执行的 GC 结果可能与 git gc
上面的命令。
关于服务器上的 Git 存储库比所有分支的本地克隆大得多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34809571/
我时不时地输入“git”,然后想到别的东西,然后输入例如“git checkout master”。当然,这给我留下了 $ git git checkout master git: 'git' is
我做到了 git 克隆 git://foo.git 光盘富 ...编辑文件.. 现在我想重新开始。我不在乎我已经做出的任何改变,但我不想再次克隆整个巨型 foo.git,只是丢失我所有的更改。我怎
我在我的电脑上开发代码,我的计算节点很少。 为了让我的程序保持同步,我决定使用 git。以前,我以一种单向模式使用它来“下推”从 PC 到计算节点的更改。但是时不时遇到计算节点特有的小bug,现场修复
虽然它似乎什么也没做,但它没有给出任何警告或错误消息。有什么想法吗? 最佳答案 来自 Git 源的注释: /* * Read a directory tree. We currently ignor
我知道如何为这样的 HTTPS 请求提供用户名和密码: git clone https://username:password@remote 但我想知道如何像这样向 Remote 提供用户名和密码:
Git GUI、Git Bash 和 Git CMD 之间有什么区别?我是初学者,为了进行安装,我发现自己通常同时使用 git bash 和 git CMD 最佳答案 Git CMD 就像使用 git
有人能告诉我git中文件索引被删除是什么意思吗?这些文件在我的 VS Code 中标记为红色,但我仍然可以修改文件并将更改推送到将反射(reflect)这些更改的远程存储库。我认为这一切都是在我使用命
我通过 git 子树将 GLFV 库添加到项目中,但出现此警告“看起来您的 git 安装或您的 git-subtree 安装已损坏”。还描述了几个原因,为什么这可能是: 如 git --exec-pa
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我一直在阅读一篇文章,作者在其中指示:在现有存储库中创建一个新存储库,并想知道这是否是他忽略的错误。稍后我会与他核实。 这些是我要检查的条件: 将现有目录制作成仓库的条件,并且已经 checkin 主
我确实在不同的计算机上处理相同的项目,我想知道是否有一种方法可以跟踪该 .git 文件夹,这样我就不必在所有本地文件中重新配置配置文件。 我将所有工作推送到 bitbucket。 最佳答案 不,没
这个问题在这里已经有了答案: How does git store files? (3 个答案) 关闭 9 年前。 我为我的许多项目创建了一个远程存储库,所以它是我的push 的目的地。与 git
应该如何在 git 中查看文件内容的完整历史记录? 一个文件在 git 中的历史很短,存储库通过 git-svn 同步,但在 svn 中的历史很长。 git 中的历史记录到达文件移动的位置。要查看历史
我是confused here ... 如何对修改后的文件进行git commit,以及如何对新文件进行git commit? 还有,你如何在git中单独提交文件? 最佳答案 git 提交过程分为两个
正在搜索 throw SO 来寻找答案。遇到这个似乎没有给出任何答案的旧线程。重新触发此线程,希望有人知道! 有人能告诉我 git subtree 和 git filter-branch 的区别吗?为
我想知道是否有一种方法可以避免在每个 Git 命令的开头键入单词 git。 如果有一种方法可以在打开命令提示符进入 “Git 模式” 后只使用一次 git 命令就好了。 例如: git> 之后,我们键
当您修改工作目录中的文件时,git 会告诉您使用“git add”暂存。 当您向工作目录添加新文件时,git 会告诉您使用“git add”开始跟踪。 我对这两个概念有点困惑,因为我假设跟踪文件的更改
为什么 git://有效 $ git clone git://github.com/schacon/grit.git Cloning into 'grit'... ... Checking conne
我在以下沙箱中练习 git:https://learngitbranching.js.org/?NODEMO 我在两个单独的 session 中运行了两组命令。第一组命令顺序如下: git clone
我是一名优秀的程序员,十分优秀!