gpt4 book ai didi

git - 折叠一个 git 仓库的历史

转载 作者:IT王子 更新时间:2023-10-29 00:32:19 25 4
gpt4 key购买 nike

我们有一个历史悠久的 git 项目。

具体来说,在项目早期,项目中有相当多的二进制资源文件,这些文件现在已被删除,因为它们实际上是外部资源。

但是,由于之前提交了这些文件,我们存储库的大小超过 200MB(目前总 checkout 约为 20MB)。

我们想要做的是“折叠”历史,这样存储库就好像是从一个比原来更晚的版本创建的。例如

1-----2-----3-----4-----+---+---+
\ /
+-----+---+---+
  1. 已创建存储库
  2. 添加了大量二进制文件
  3. 删除了大量二进制文件
  4. 存储库的新预期“开始”

所以实际上我们想要在某个时间点之前丢失项目历史记录。此时只有一个分支,因此尝试处理多个起点等并不复杂。但是我们不想丢失所有历史记录并使用当前版本启动一个新存储库。

这是可能的,还是我们注定要永远拥有一个臃肿的存储库?

最佳答案

您可以删除二进制膨胀并保留其余的历史记录。 Git 允许您重新排序和“压缩”之前的提交,因此您可以只 merge 添加和删除大二进制文件的提交。如果添加全部在一次提交中完成,删除在另一次提交中完成,这将比处理每个文件容易得多。

$ git log --stat       # list all commits and commit messages 

在此搜索添加和删除二进制文件的提交并记下它们的 SHA1,例如 2bcdef3cdef3

然后要编辑存储库的历史记录,请使用带有交互选项的 rebase -i 命令,从添加二进制文件的提交的父级开始。它将启动您的 $EDITOR,您将看到以 2bcdef 开头的提交列表:

$ git rebase -i 2bcdef^    # generate a pick list of all commits starting with 2bcdef
# Rebasing zzzzzz onto yyyyyyy
#
# Commands:
# pick = use commit
# edit = use commit, but stop for amending
# squash = use commit, but meld into previous commit
#
# If you remove a line here THAT COMMIT WILL BE LOST.
#
pick 2bcdef Add binary files and other edits
pick xxxxxx Another change
.
.
pick 3cdef3 Remove binary files; link to them as external resources
.
.

squash 3cdef3 作为第二行插入,并从列表中删除显示 pick 3cdef3 的行。您现在有了交互式 rebase 的操作列表,它将添加和删除二进制文件的提交 merge 到一个提交中,其差异只是这些提交中的任何其他更改。然后,当您告诉它完成时,它将按顺序重新应用所有后续提交:

$ git rebase --continue

这需要一两分钟。
你现在有一个不再有二进制文件来来去去的 repo 协议(protocol)。但是它们仍然会占用空间,因为默认情况下,Git 会在垃圾收集之前将更改保留 30 天左右,这样您就可以改变主意。如果你现在想删除它们:

$ git reflog expire --expire=1.minute refs/heads/master
#all deletions up to 1 minute ago available to be garbage-collected
$ git fsck --unreachable # lists all the blobs(files) that will be garbage-collected
$ git prune
$ git gc

现在您已经删除了膨胀但保留了其余的历史记录。

关于git - 折叠一个 git 仓库的历史,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/250238/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com