gpt4 book ai didi

git - 如何使git理解Mac(CR)行尾

转载 作者:太空狗 更新时间:2023-10-29 14:03:00 25 4
gpt4 key购买 nike

出于某些原因,我的一个文件包含旧样式的mac行结尾(在osx上编辑后)。这些是“CR”(回车)字符,在git diff中显示为^m。
git不理解它们是行尾代码(真的有多难?)并将整个文件解释为一行。
我知道我可以将文件转换为lf或crlf结尾,然后将它们提交回去,但是由于git自动将我的windows(crlf)行结尾转换为lf,我希望它也能处理cr行结尾。
有没有办法让git将cr解释为行尾?

最佳答案

TL;博士
创建过滤器驱动程序加上:创建运行.gitattributes的污迹过滤器和运行tr '\n' '\r'的干净过滤器,并将有问题的文件标记为使用此过滤器。只使用lf行尾将文件存储在git中。(过滤器驱动程序在tr '\r' '\n'.git/config文件中定义,文件的名称或名称模式进入$HOME/.gitconfig

如您所见,git非常喜欢以换行符结尾的行。(它可以处理换行分隔的行,其中最后一行缺少终止符,但这意味着添加一行将导致对前一个最后一行的更改,因为现在它有了换行终止符,而新的最后一行缺少换行终止符。)这与单个快照无关,但是对于产生有用的差异确实很重要。
现代的macos像其他人一样使用新线。只有古老的向后兼容格式才有仅限CR的行尾。参见,例如,this SuperUser Stack Exchange web site posting
Git没有用于转换为或从这样的行尾的内置筛选器。然而,git确实有一个通用的机制来对工作树文件进行更改。
记住,当git在快照中存储任何文件时,该文件由git所称的blob对象表示,blob对象在内部以一种特殊的、压缩的(有时是高度压缩的)git-only形式存储。这个表单除了git之外对其他任何东西都没有用处,因此当您通过.gitattributes获得有用表单中的文件时,例如git将它们扩展为您计算机的常用表单。同时,任何时候,当您获取像这样的普通文件并将其转换为git-only格式时,git都会将该文件压缩为git-only格式。每当您使用git checkout将文件复制回git的索引时,都会发生这种情况。
每一个文件的索引拷贝都存在于工作树所在的位置,就像提交的副本一样。索引副本的格式与git-only格式相同。这里的关键区别在于提交的副本不能更改,但是索引副本可以更改。运行git add将获取索引中此时的任何内容的快照,并使其成为新提交的新快照。因此,索引充当将进入下一次提交的内容。使用git commit,将一些现有的提交复制到索引中,并将Git扩展到工作树中,然后使用git checkout,用有更改的工作树文件的压缩版本选择性地替换特定索引副本。
在索引和工作树之间或从索引和工作树之间进行复制是进行windows样式lf到crlf转换的理想点,反之亦然,因此git就是在这里进行复制的。如果有其他转换要执行,而不是直接内置到git中,那么这就是告诉git执行转换的地方。
污渍和清洁过滤器
污迹过滤器是git在将文件从压缩索引副本转换为工作树副本时应用的过滤器。在这里,如果您选择用crlf windows风格的换行符或分隔符替换换行符,git有一个内部转换器可以做到这一点:git add。一个干净的过滤器是git在将文件从未压缩的工作树副本转换为压缩索引副本时应用的过滤器;这里,eol=crlf再次指示git进行反向转换。
如果你只想用CR替换换行符,你必须发明自己的转换器。假设您将整个过程称为:

*.csv   filter=convert-cr

(而不是 eol=crlf)。这一行进入 convert-cr(这是一个可提交的文件,您应该提交它)。
现在您必须定义 *.csv eol=crlf过滤器。在git配置文件中,我们发现了一个小缺陷:配置文件不可提交。这是一个安全问题:git将在这里运行任意命令,如果我可以提交这个文件并克隆它,您将运行我指定的命令,而不必先检查它们。因此,您必须自己将其放入 .gitattributes或全局配置中(例如 convert-cr):
[filter "convert-cr"]
clean = tr '\r' '\n'
smudge = tr '\n' '\r'

现在,每当git从git-only格式转换时,它将把换行转换成crs,每当git转换成git-only格式时,它将把crs转换成换行。
这对现有存储文件没有帮助。
任何你现在拥有的在它们里面有 .git/config的快照,都会被永远保存下去。Git永远不会改变任何现有的存储文件!存储的数据是珍贵和不可侵犯的。你对此无能为力。好吧,几乎什么都没有:您可以完全抛出那些提交,生成新的和改进的提交,然后改用它们。但这是相当痛苦的:每个提交都会记住其父提交,因此如果替换存储库中的早期提交,则必须替换每个子提交、孙子提交等,以便它们都记住这一新的提交序列。( git config --global --edit完成此任务。)
但是,您可以指示Git关于如何在现有提交中区分特定文件,也可以使用 \r和DIFF驱动程序。有多种方法可以做到这一点,但最简单的方法是定义一个textconv属性,该属性将一个“二进制”文件(如存储版本可能只有CR字符的文件)转换为一个文本(面向行,即基于换行)文件。这里使用的textconv过滤器与smudge过滤器完全相同。
有关详细信息,请参见 the gitattributes documentation

关于git - 如何使git理解Mac(CR)行尾,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52179708/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com