gpt4 book ai didi

macos - 不区分大小写的搜索并用 sed 替换

转载 作者:行者123 更新时间:2023-12-01 18:15:03 27 4
gpt4 key购买 nike

我正在尝试使用 SED 从日志文件中提取文本。我可以毫不费力地进行搜索和替换:

sed 's/foo/bar/' mylog.txt

但是,我想让搜索不区分大小写。根据我在谷歌上搜索到的内容,看起来将 i 附加到命令末尾应该有效:

sed 's/foo/bar/i' mylog.txt

但是,这给了我一条错误消息:

sed: 1: "s/foo/bar/i": bad flag in substitute command: 'i'

这里出了什么问题,如何解决?

最佳答案

更新:从 ma​​cOS Big Sur (11.0) 开始,sed 现在确实支持I 标记用于不区分大小写的匹配,因此问题中的命令现在应该可以工作(BSD sed 不会报告其版本,但您可以通过man 页面底部的日期,应为 2017 年 3 月 27 日 或更晚);一个简单的例子:

# BSD sed on macOS Big Sur and above (and GNU sed, the default on Linux)
$ sed 's/ö/@/I' <<<'FÖO'
F@O # `I` matched the uppercase Ö correctly against its lowercase counterpart

注意:I(大写)是标志的记录形式,但 i 也可以工作。

同样,从 ma​​cOS Big Sur (11.0) 开始 awk 现在区域设置感知 (awk --version 应报告 20200816 或更新版本):

# BSD awk on macOS Big Sur and above (and GNU awk, the default on Linux)
$ awk 'tolower($0)' <<<'FÖO'
föo # non-ASCII character Ö was properly lowercased
<小时/>

以下内容适用于 ma​​cOS Catalina 及更高版本 (10.15):

需要明确的是:在 macOS 上,sed - 这是 BSD 实现 - 不支持不区分大小写的匹配 - 很难相信, 但是是真的。 formerly accepted answer本身显示了一个 GNU sed 命令,由于评论中提到的基于 perl 的解决方案而获得了该状态。

要使该 Perl 解决方案也能通过 UTF-8 处理外来字符,请使用如下内容:

perl -C -Mutf8 -pe 's/öœ/oo/i' <<< "FÖŒ" # -> "Foo"
  • -C 打开对流和文件的 UTF-8 支持,假设当前区域设置基于 UTF-8。
  • -Mutf8 告诉 Perl 将源代码解释为 UTF-8(在本例中,字符串传递给 -pe) -这是更详细的 -e 'use utf8;' 的较短版本。谢谢,Mark Reed

(请注意,使用 awk 也不是一个选项,如 macOS 上的 awk(即 BWK awkBSD awk) 似乎完全不知道语言环境 - 它的 tolower()toupper() 函数忽略外来字符(并且 sub()/gsub() 没有不区分大小写的标志)。)

<小时/>

关于 sedawk 与 POSIX 标准关系的注释:

BSD sedawk 将其功能主要限制为POSIX sedPOSIX awk规范要求,而 GNU 对应项则实现更多扩展。

关于macos - 不区分大小写的搜索并用 sed 替换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4412945/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com