- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想将一些文件提取到新的存储库中,保留它们的历史记录,包括文件重命名。
我能找到的最佳和最接近的答案是 new-repo-with-copied-history-of-only-currently-tracked-files ,使用 git filter-branch --index-filter
。它成功地保留了现有文件的历史记录,但不保留重命名文件的历史记录。
(我能找到的另一个答案是使用 git filter-branch --subdirectory-filter
。但它有两个问题:似乎不适用于整个 repo(文件夹“.”)并且不保留重命名文件的历史记录。)
(另一个答案是使用 git subtree
。但它根本不保留历史。)
所以我可能正在寻找一种方法来改进 git ls-files > keep-these.txt
命令,从最接近的答案到还列出所有以前的文件名 .也许是脚本?
最佳答案
Git 不存储文件名更改。
每个提交存储一个完整的树,例如,可能提交 1234567...
有文件 README
和 foo.txt
和提交 fedcba9。 .. 有文件 readme.txt
和 foo
。如果您要求 git 比较提交 1234567
与提交 fedcba9
,并且 README
与 足够相似1 readme.txt
,git会说将一个提交转换为另一个提交的方法是重命名文件。 (如果一个提交是另一个的父提交,子提交的 git show
将显示重命名,因为 git show
在 git show
时间。)
另一方面,如果第二个 readme
文件差异太大,但 README
与 foo
足够相似,git 会说改变1234567
实现fedcba9
的方法是将README
重命名为foo
。
关键是 git 计算那个当你要求比较时,而不是更早。提交之间没有任何内容表示“重命名某些文件”。 Git 只是比较提交并决定然后文件是否足够相似。
就您的目的而言,这最终意味着对于您的复制或部分复制提交序列中的每个提交,您必须决定保留哪些路径名以及丢弃哪些路径名。如何实现这一目标主要取决于您。 git log
命令确实有一个 --follow
标志来激活有限数量的重命名检测,因为它从子提交到他们的父提交向后工作,而 git blame
自动尝试做同样的事情;您可以使用这些(一次一个路径名)来得出以下形式的映射:
in: commits A..B C..D E..F
use path: dir/file.ext dir/frill.txt lib/frill.next
例如。但是没有内置的东西可以做到这一点,而且也不会特别容易。我首先将 git log --follow
与 --raw
或 --name-status
输出结合起来,看看是否有任何有趣的检测到重命名。如果有的话,这些是提交边界,您将在提交边界处更改要保留和丢弃的路径(无论是使用 filter-branch
还是其他方法).
如果这不起作用,或者您需要更多控制,请考虑在各种提交对之间运行 git diff --name-status
(提交对信息来自 git rev-list
)。
1只要您要求进行重命名检测,“完全相同”就足够相似了,任何低至“50% 相似”的东西都是如此。您可以使用提供给 git diff
的 -M
标志的可选值来调整所需的相似度。
编辑:这似乎工作正常。我是在git自带的builtin/var.c
上使用的,以前有两个名字是这样的:
$ git log --follow --raw --diff-filter=R --pretty=format:%H builtin/var.c
81b50f3ce40bfdd66e5d967bf82be001039a9a98
:100644 100644 2280518... 2280518... R100 builtin-var.c builtin/var.c
55b6745d633b9501576eb02183da0b0fb1cee964
:100644 100644 d9892f8... 2280518... R096 var.c builtin-var.c
--diff-filter
抑制除重命名输出之外的所有内容,以便我们能够看到哪个提交似乎重命名了文件。将它变成更有用的东西需要更多的工作,但这可能会让你走得更远:
git log --follow --raw --diff-filter=R --pretty=format:%H builtin/var.c |
while true; do
if ! read hash; then break; fi
IFS=$'\t' read mode_etc oldname newname
read blankline
echo in $hash, rename $oldname to $newname
done
产生了:
in 81b50f3ce40bfdd66e5d967bf82be001039a9a98, rename builtin-var.c to builtin/var.c
in 55b6745d633b9501576eb02183da0b0fb1cee964, rename var.c to builtin-var.c
关于git - 清除已删除文件的 git 历史记录,保留重命名文件的历史记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33865637/
背景 之前陆续写过一些和 OpenTelemetry 相关的文章: 实战:如何优雅的从 Skywalking 切换到 OpenTelemetry 实战:如何编写一个 OpenTeleme
我很困惑PSReadLine历史在 Powershell 中跨 session 工作。我可以在 PS 版本 5.1 中看到我以前的命令历史记录自动存储在 %userprofile%\AppData\R
我有一个实体,我正在从面板中保存我们的数据库,您可以在其中执行常规操作(编辑、添加等)。不是很大,大多数时候大约有 1k 行,而且这个数字可能总是在这个左右。该实体有一些与其他实体相关的字段(例如:位
有时有人想直接在环境中更改 crx 中的内容。 这通常是环境不工作状态的原因。而且往往很难找到问题的原因。而且我认为如果 cq5 crx 有审计日志会很有帮助。像这样。 12.12.12 21:03
这个问题与可以在其他问题之一中找到的模式有关here.基本上在数据库中,我存储用户,位置,传感器等。所有这些内容都可以由用户在系统中编辑,并且可以删除。 但是-在编辑或删除项目时,我需要存储旧数据;我
我需要随时跟踪许多项目及其状态。 例子 ItemId Location DateTime State 1 Mall A 2010-02-03 07:00 on
我有这个方法来添加 fragment : public void addFragmentOnTop(Fragment fragment) { getSupportFragmentManager()
我想了解 HTML5 历史对象。这是我开始的一个简单示例。 function addDialog(){ document.getElementById('d').style.
我如何使用 HTML5 history api。我确实通过了https://developer.mozilla.org/en/DOM/Manipulating_the_browser_history
我正在尝试找出在关系数据库中保存表的历史记录/修订的最佳方法。 我进行了一些研究和阅读,但不确定跟踪更改的最佳方式是什么。对于我的主表,我很确定我已经确定了一个修订表,以保持跟踪(见图),但我不确定是
这个问题在这里已经有了答案: Git: discover which commits ever touched a range of lines (6 个答案) 关闭 9 年前。 我一直在研究 gi
我有一个相当复杂的程序(带有 SWIG'ed C++ 代码的 Python,长期运行的服务器),它显示了不断增长的常驻内存使用量。我一直在使用常用的泄漏工具(valgrind、Pythons gc 模
我的 Git 存储库中有一行包含单词“Foo”的数百次提交。 是否有任何方法可以在上次的位置找到它的修订号? 最佳答案 这可以通过 -S 的镐 ( gitlog ) 选项来解决。 git log -
我不小心删除了一个文件(我不是他的创建者)并提交并将其推送到远程。现在我想让 git 取消删除此更改,但是当我使用 git revert #mistaken commit 时,它可以工作,但指责信息指
我使用 spyder 历史 Pane 查看我过去尝试过的命令,但最近我注意到它不会在我键入命令时更新。屏幕截图 1 显示了控制台和历史记录 Pane ,因为您可以看到历史记录中没有显示任何控制台条目。
我的应用程序使用 Camunda 7.7 运行。到目前为止,所有数据都保存在 Camunda 表 (ACT_XXX) 中——它们变得很大。所以现在我想清理表格并配置 Camunda,以便在 14 天后
我在 SVN 上有一个这样组织的旧项目: /一些/子目录/a/trunk/foo /一些/子目录/b/trunk/foo /一些/子目录/c/trunk/foo 我使用GitHub工具git-impo
我有一个通用的工作功能,为此我将使用 GNU Radio 的历史记录功能。在 block 的构造函数中,我调用了 set_history( m )。我以标准方式转换输入缓冲区: const flo
当我加载 php 页面时,我会附加一些数据。例如 MyPage.php?value=something。正如预期的那样,当我使用后退按钮来回移动时,它总是会加载附加的相同数据。我不想那样。我希望在页面
我们有一个相当大的库,我们需要定期将其导入(然后修补)到我们的代码库中。 SVN Book 似乎推荐了一个“vendor branch”方案,我们保留了“vendor drops”的补丁版本。这会起作
我是一名优秀的程序员,十分优秀!