- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我被聘为顾问,与糟糕的内部人员一起工作 DSL被一家大公司使用。
我说糟糕是因为代码行不是用回车符或换行符来结束每行代码,而是用五个字符的 ASCII 字符串 <EOL>
分隔的。 .这些文件有数千“行”长。任何嵌入的回车符或换行符往往会使解释器崩溃。
我无法更改他们的解释器或语言,但我需要使用用这种语言编写的庞大(>100 MB)代码库。
在对这段代码进行任何更改之前,我想将其放入一个 git 存储库中以进行跟踪。有没有办法告诉 git 字符串 <EOL>
表示行尾,就像您可以指定 LF
一样或 CR+LF
与 core.eol=lf
?例如,core.eol="<EOL>"
.如果是这样,这将使我的生活在两个方面变得更轻松:
<EOL>
检查原始代码作为行尾,然后在另一台机器上使用 core.eol=lf
检查它set,git 会自动来回转换。 (我可以使用常规文本编辑器和常规工具!)我确实认识到这是一个小众的边缘案例。我也知道我可以添加一个中间处理步骤来在与 git 交互之前来回转换,但我想避免这种情况,除非绝对必要,因为我更愿意将他们现有的代码库直接导入 git 而无需先对其进行预处理。
如果此功能不可用,我什至更愿意创建自定义版本的 git 而不是添加额外的处理步骤,因此如果有人知道其中可能涉及哪些复杂性,我将有兴趣了解这些。
最佳答案
此自定义过滤器设置将导致 *.dsl
包含 <EOL>
的文件在 Git 存储中,但是 \n
在您的工作目录中 checkout 时。 git diff
等工具将在 checkout 版本上运行(例如 \n
)。这是你想要的吗?
~/.gitconfig
或 .git/config
[filter "crazy-eol"]
clean = awk 'BEGIN{ORS="<EOL>"}1'
smudge = awk 'BEGIN{RS="<EOL>"}1'
[diff "crazy-eol"]
textconv = awk 'BEGIN{RS="<EOL>"}1'
.gitattributes
或 .git/info/attributes
*.dsl filter=crazy-eol diff=crazy-eol
关于git - git 中的自定义行结尾(LF 和 CR+LF 除外),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44058263/
我正在编写在 Windows 中运行并输出文本文件的代码,该文本文件后来成为 Linux 程序的输入。当给定的文件具有 CR+LF 而不仅仅是 LF 的换行符时,此程序的行为不正确。 我知道我可以使用
我想知道之间的区别(如果可能的话提供示例)CR LF (Windows)、LF (Unix) 和 CR (Macintosh) 换行符类型。 最佳答案 CR和LF是控制字符,分别编码为0x0D(十进制
我们有一个名为 LineFeed.sh 的 shell 脚本文件它执行将换行符( LF )转换为回车+换行符的功能。我们希望通过 windows 中的批处理文件完成相同的操作。是否可以? Linux
我想查询我的表中有多少行包含一个或多个 实例。我想不出正确的语法。我会尝试 LIKE '%%',但我不知道如何指定这些特殊字符。我试过 where mydata REGEXP '%[.CR.][.LF
我必须编写一个功能类似于 dos2unix 的 C 程序。它将所有 CR LF 替换为仅 LF(DOS 格式到 Unix 格式)。所以这是我的方法。每次我读一行时,我通过查找 \0 来搜索数据的结尾,
我有一个 UTF-16 编码的文件,我想用 Windows 行结尾替换 UNIX 行结尾。我不想碰其他任何东西。 有没有linux命令行工具可以搜索两个字节“0A 00”并用四个字节“0D 00 0A
在 Windows 上 #include int main() { putc('A',stdout); putc('\r',stdout); putc('\n',stdout
在 Windows 中,当您以文本模式从文件(或标准输入)读取字符 \r\n 时,\r 被删除,您只能读取 \n. 是否有一个标准应该如此? 我能确定这对 Windows 上的任何编译器都是正确的吗?
我被聘为顾问,与糟糕的内部人员一起工作 DSL被一家大公司使用。 我说糟糕是因为代码行不是用回车符或换行符来结束每行代码,而是用五个字符的 ASCII 字符串 分隔的。 .这些文件有数千“行”长。任
我正在 Windows 10 上开发一个 Unity 3D C# 项目,并开始一个新的存储库,我将其添加到我的 .gitattributes 中。文件: # These files are text
我正在 Linux 平台上编写一个程序,该程序生成的文本文件将不可避免地在 Windows 平台上查看。 现在,将 std::endl 传递到 ostream 中仅为换行符生成 CR 字符。当然,这些
交换换行符(例如通过某些文本编辑器)是否会破坏 javascript 代码? 最佳答案 两个控制字符都是valid line breaks .事实上你甚至不需要换行符。这只是为了更好的可读性。除了在字
在 MS Windows 上,使用 Python 3 的 pyodbc 模块,我正在使用 PostgreSQL。当我使用 PostgreSQL 的 TEXT 数据类型并尝试存储类 UNIX 的 EOL
我正在学习 C,我有以下代码: #include #include #include int main(int argc, char *argv[]) { double x; print
我想强制 Git 在 Windows 下使用 LF 而不是 CR+LF check out 文件。 我检查了两个配置选项,但无法找到正确的设置组合。 我想将所有文件转换为具有 LF 换行符并在文件中保
我是一名 Java 开发人员,我正在使用 Ubuntu 进行开发。该项目是在 Windows 中使用 Eclipse 创建的,它使用 Windows-1252编码。 为了转换为 UTF-8,我使用了
我有一个字符串,我想控制它的字符串内容 是否包含 (CR、LF 或 CRLF)? if (no CR, LF or CF or LF) in string: echo 'no sepator
我有一个包含“unix 风格”行尾的文本文件:每行末尾有一个 0x0A。 我正在编写一个脚本来修改该文件,以向其中添加新内容。这是在 Windows 上运行的 JScript。代码如下所示:
为什么 Firefox 和 Chrome 在 POST 时将 LF 字符替换为 CR+LF? 我写了以下内容作为测试: function lftest() { var linefeed
这与这个问题非常相似: What is the differrence between `* text=auto` and `* text eol=lf` in .gitattributes? 但我特
我是一名优秀的程序员,十分优秀!