- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我知道 Linux 文件系统将文件名存储为字节序列,这意味着独立于 Unicode 编码。
但是,UTF-8 或增强型 UTF-8 以外的编码可能会很好地使用 0 字节作为可以出现在文件名中的 Unicode 字符的多字节表示的一部分。在 Linux 文件系统 C 代码中,到处都是以 0 字节终止字符串。那么 Linux 文件系统是如何支持 Unicode 的呢?它是否假定所有创建文件名的应用程序仅使用 UTF-8?但事实并非如此,对吗?
类似地,shell(例如 bash)在模式中使用 *
来匹配任意数量的文件名字符。我可以在 shell C 代码中看到它只是将 ASCII 字节用于 *
并逐字节地分隔匹配项。对于 UTF-8 编码的名称很好,因为它具有这样的属性,如果您采用字符串的字节表示,然后从开头匹配一些字节与 *
,并将其余字节与另一个字符串匹配,然后开头的字节实际上匹配了一串完整的字符,而不仅仅是字节。
但是其他编码没有那个属性,是吗?那么,shell 是否采用 UTF-8?
最佳答案
确实,UTF-16 和其他“宽字符”编码不能用于 Linux 中的路径名(也不能用于任何其他兼容 POSIX 的操作系统)。
原则上不任何人都假定 UTF-8 是正确的,尽管随着其他编码的消失,这在未来可能会成为正确的。 Unix 风格的程序采用的是一种ASCII 兼容 编码。具有这些属性的任何编码都是 ASCII 兼容的:
/
。)UTF-8 与 ASCII 兼容,但所有 ISO-8859-n 页面也是如此,EUC编码,还有很多很多其他的。
一些程序可能还需要一个额外的属性:
UTF-8 有这个属性,但(我认为)EUC-JP 没有。
也是许多“Unix 风格”程序保留代码点 U+000000 (NUL) 用作字符串终止符的情况。这在技术上不是对编码的约束,而是对文本本身的约束。 (字节 0x00 不出现在字符串中间的密切相关要求是此加上要求 0x00 映射到 U+000000 而不管周围上下文的结果。)
关于linux - Linux shell 和文件系统如何识别 Unicode?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38948141/
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
我有几个脚本,它们的第一部分看起来是一样的。这部分的功能是识别脚本在哪台机器上运行并相应地设置几个变量。它看起来像这样: ENV=`echo $LOGNAME | cut -c1-8` if
这是我正在尝试做的事情。我有 4 个 shell 脚本。脚本 1 需要先运行,然后是 2,然后是 3,然后是 4,并且它们必须按此顺序运行。脚本 1 需要运行(并在后台等待)2 才能正常运行,但是脚本
我有一个名为 a.sh 的脚本,其中的内容是: //a.sh: #!/bin/bash temp=0 while [ "$temp" -ne 500 ] do echo `date`
在snakemake中,使用shell()函数执行多个命令的推荐方式是什么? 最佳答案 您可以调用shell()多次内run规则块(规则可以指定 run: 而不是 shell: ): rule pro
我有一个 shell 脚本,我向其中传递了一些参数。Test1.sh -a 1 -b 2 -c“一二三” 在 Test1.sh 中,我按以下方式调用另一个 shell 脚本。Test2.sh $* 我
我有 2 个 shell 脚本。 第二个shell脚本包含以下函数第二个.sh func1 func2 first.sh 将使用一些参数调用第二个 shell 脚本, 将使用特定于该函数的一些其他参数
我有一个 Unix shell 脚本 test.sh。在脚本中,我想调用另一个 shell,然后从子 shell 执行 shell 脚本中的其余命令并退出 说清楚: test.sh #! /bin/b
我想在 shell 脚本中更改路径环境变量。路径变量需要在shell脚本执行后修改。 最佳答案 我知道有两种方法可以做到这一点。第一种是在当前 shell 的上下文中运行脚本: . myscript.
此 shell 脚本按预期运行。 trap 'echo exit' EXIT foo() { exit } echo begin foo echo end 这是输出。 $ sh foo.sh
我正在使用 vimshell在 vim 中执行命令 nnoremap vs :VimShellPop 使用此键映射,我可以打开 vim shell 并执行诸如“捆绑安装”之类的命令,然后 输入 exi
我想连接到不同的 shell(csh、ksh 等)并在每个切换的 shell 中执行命令。 下面是反射(reflect)我的意图的示例程序: #!/bin/bash echo $SHELL csh e
我目前正在尝试使用 BNF 和 LL 解析器在 C 中重新编写 shell。 否则,我需要知道 shell 运算符的优先级是什么| , > , > , & , ; ? 有没有人可以提供给我? 谢谢 最
不幸的是,我没有suspend 命令(busybox/ash)。但是我可以使用 kill -STOP $$ 从后台 shell (sh &) 返回到父 shell(以及 fg 之后)。 但是我不想输入
我需要知道,当用户切换到另一个 shell 时,通过单击它。 我试过 shellListener.shellDeactivated()但是当 shell 失去对它自己的控件的焦点时,会触发此事件,这意
file1.txt aaaa bbbb cccc dddd eeee file2.txt DDDD cccc aaaa 结果 bbbb eeee 如果能不区分大小写就更好了! 谢谢! 最佳答案 gre
我见过解压缩目录中所有 zip 文件的循环。但是,在运行此之前,我宁愿确保我将要运行的内容正常工作: for i in dir; do cd $i; unzip '*.zip'; rm -rf *.z
我对编程还很陌生,但我想知道 vim、emacs、nano 等 shell 文本编辑器如何能够控制命令行窗口。我主要是一名 Windows 程序员,所以可能在 *nix 上有所不同。据我所知,只能将文
我有一个包含第 7 列日期的文件,我的要求是将它与今天的日期进行比较,如果小于它,则删除该完整行。 此外,如果第 7 列中提到的任何日期超过 15 天,则将其修改为最多 15 天 下面的例子- now
我是一名优秀的程序员,十分优秀!