gpt4 book ai didi

git-filter-branch - 如何在 git filter-branch 上保留标签以进行修剪空或子目录过滤器

转载 作者:行者123 更新时间:2023-12-02 02:18:05 24 4
gpt4 key购买 nike

git filter-branch --tag-name-filter cat …改写历史时通过使用 --prune-empty和/或 --subdirectory-filter=…您将遇到这样的情况:标记的提交被删除。到目前为止这是合理的并且按设计工作。

问题/目标

我现在想要归档的是:将标签保留在附近重写的提交上

示例:

A -> B(tag: foo) -> C -> D -> E开始

(其中 E 比 D 更新,比 C 更新……)

正在运行git filter-branch我得到要么

  • 获取A' -> B'(tag: foo)' -> E (^好案例)

  • 或:A' -> D' -> E' (^坏的情况)

我想要得到的是:A'(tag: foo)' -> D' -> E'A'代表 B 中标记的内容

一些研究:我遇到的第一件事是 git cherryGit: Is there a way to figure out where a commit was cherry-pick'ed from?但这似乎对发现差异没有多大帮助,因为树是分离的。

相反,我已经找到了 --commit-filter 的有用示例https://stackoverflow.com/a/14783391/529977写入重写对象的日志

一些想法:这样--commit-filter记住“映射文件”,理论上我能够

  1. 过滤重写树中未设置的所有标签
    • 找不到如何在树中过滤该信息
  2. 迭代有疑问的标签列表
  3. 读取原始提交点git log --oneline -1 ${tag}
  4. 查找原始树的历史记录,以查找已知被重写的任何较新提交
    • 正向查找也很困难
    • 或者从任何重写的提交中查找历史记录来查找标签
  5. 将标签移动到新树中的第一个匹配项
    • 已知问题:如何保留所有信息,我不想用经典方式重新标记
  6. 跳过标签,如果只有在另一个标签之后重写的提交
    • 如何确定相关提交是否有标签

我的其他想法是:

  • 通过比较 git log -1 --format="%an%ae%at%cn%ce%ct%s" | sha1sum 查找任何“相似”提交在原始树中,然后遍历历史记录到下一个已知标签,但这接近上面的想法

听起来仍然是一个困难的方法,即使我没有一个好主意来解决这些步骤......任何其他想法或已知的解决方案(?!)欢迎!

最佳答案

Deleted:           *    *         *                   *    *         *
Tags: R S T U V W
Commits: A -> B -> C -> D -> E -> F -> G -> H -> I -> J -> K -> L -> M -> N

预期输出:

Tags:         R    T              V    W
Commits: A -> B -> E -> G -> H -> I -> L -> N

我们将使用 --prune-empty 对此进行测试,因此我们将为应删除的提交创建空提交。让我们设置测试存储库。

git init

touch n && git add n && git commit -m "N"
git commit --allow-empty -m "M"
touch l && git add l && git commit -m "L"
git commit --allow-empty -m "K"
git commit --allow-empty -m "J"
touch i && git add i && git commit -m "I"
touch h && git add h && git commit -m "H"
touch g && git add g && git commit -m "G"
git commit --allow-empty -m "F"
touch e && git add e && git commit -m "E"
git commit --allow-empty -m "D"
git commit --allow-empty -m "C"
touch b && git add b && git commit -m "B"
touch a && git add a && git commit -m "A"

git tag W $(git log --pretty=oneline --grep=M | cut -d " " -f1)
git tag V $(git log --pretty=oneline --grep=K | cut -d " " -f1)
git tag U $(git log --pretty=oneline --grep=F | cut -d " " -f1)
git tag T $(git log --pretty=oneline --grep=E | cut -d " " -f1)
git tag S $(git log --pretty=oneline --grep=D | cut -d " " -f1)
git tag R $(git log --pretty=oneline --grep=C | cut -d " " -f1)

首先,我们将创建一个包含所有标签名称及其指向的提交哈希的文件。

for i in $(git tag); do echo $i; git log -1 --pretty=oneline $i | cut -d " " -f1; done > ../tags

运行git filter-branch时,提交哈希值将会改变。为了跟踪这些更改,我们创建一个文件,其中包含从旧提交哈希值到新提交哈希值的映射。 here 显示了做到这一点的技巧。 .

--subdirectory-filter=... 命令将如下所示:

git filter-branch --subdirectory-filter=... --commit-filter 'echo -n "${GIT_COMMIT}," >>/tmp/commap; git commit-tree "$@" | tee -a /tmp/commap'

由于 --prune-empty 选项与 --commit-filter 冲突,我们需要进行一些更改。 --prune-empty 的文档在这里提供帮助:

Some filters will generate empty commits that leave the tree untouched. This option instructs git-filter-branch to remove such commits if they have exactly one or zero non-pruned parents; merge commits will therefore remain intact. This option cannot be used together with --commit-filter, though the same effect can be achieved by using the provided git_commit_non_empty_tree function in a commit filter.

因此,我们将用于此测试的 --prune-empty 命令如下所示。在运行该命令之前,请确保 /tmp/commap 不存在或为空。

git filter-branch --commit-filter 'echo -n "${GIT_COMMIT}," >>/tmp/commap; git_commit_non_empty_tree "$@" | tee -a /tmp/commap'
mv /tmp/commap ../commap

现在我们运行 git filter-branch 并收集处理标签所需的所有信息。我们必须删除标签,并且必须更改提交标签指向的位置。我们很幸运,git 将标签指向的提交哈希存储在 .git/refs/tags/TAGNAME 中。

现在剩下的就是编写一个脚本来自动更正标签。这是我用 Python 编写的内容。

def delete(tagname):
print('git tag -d {}'.format(tagname))

def move(tagname, tagref):
print('echo "{}" > .git/refs/tags/{}'.format(tagref, tagname))

tags = {}
with open('tags') as tagsfile:
for i, line in enumerate(tagsfile):
if i%2 == 0:
tagname = line[:-1]
else:
# if there are multiple tags on one commit
# we discard all but one
tagref = line[:-1]
if tagref in tags:
delete(tags[tagref])
tags[tagref] = tagname

commap = []
with open('commap') as commapfile:
for line in commapfile:
old, new = line[:-1].split(',')
commap.append((old, new))

lastnew = None
takentag = None
for old, new in commap:
if old in tags:
if takentag:
delete(takentag)
takentag = tags[old]
if new != lastnew:
# commit was not deleted
if takentag:
move(takentag, new)
takentag = None
lastnew = new

脚本输出调整标签所需的命令。在我们的示例中,这是输出:

echo "0593fe3aa7a50d41602697f51f800d34b9887ba3" > .git/refs/tags/W
echo "93e65edf18ec8e33e5cc048e87f8a9c5270dd095" > .git/refs/tags/V
git tag -d U
echo "41d9e45de069df2c8f2fdf9ba1d2a8b3801e49b2" > .git/refs/tags/T
git tag -d S
echo "a0c4c919f841295cfdb536fcf8f7d50227e8f062" > .git/refs/tags/R

将命令粘贴到控制台后,git 存储库看起来如预期:

$ git log
8945e933c1d8841ffee9e0bca1af1fce84c2977d A
a0c4c919f841295cfdb536fcf8f7d50227e8f062 B
41d9e45de069df2c8f2fdf9ba1d2a8b3801e49b2 E
6af1365157d705bff79e8c024df544fcd24371bb G
108ddf9f5f0a8c8d1e17042422fdffeb147361f2 H
93e65edf18ec8e33e5cc048e87f8a9c5270dd095 I
0593fe3aa7a50d41602697f51f800d34b9887ba3 L
5200d5046bc92f4dbe2aee4d24637655f2af5d62 N
$ git tag
R
T
V
W
$ git log -1 --pretty=oneline R
a0c4c919f841295cfdb536fcf8f7d50227e8f062 B
$ git log -1 --pretty=oneline T
41d9e45de069df2c8f2fdf9ba1d2a8b3801e49b2 E
$ git log -1 --pretty=oneline V
93e65edf18ec8e33e5cc048e87f8a9c5270dd095 I
$ git log -1 --pretty=oneline W
0593fe3aa7a50d41602697f51f800d34b9887ba3 L

关于git-filter-branch - 如何在 git filter-branch 上保留标签以进行修剪空或子目录过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45632457/

24 4 0