gpt4 book ai didi

bash - 如何使用 bash 工具搜索非 ASCII 字符?

转载 作者:行者123 更新时间:2023-11-29 08:43:45 25 4
gpt4 key购买 nike

我有一个很大的文本文件,其中包含一些使 LaTeX 崩溃的 unicode 字符。如何在 Linux bash 中使用 sed 等查找文件中的非 ASCII 字符?

最佳答案

尝试:

nonascii() { LANG=C grep --color=always '[^ -~]\+'; }

可以这样使用:

printf 'ŨTF8\n' | nonascii

[] 中,^ 表示“不”。所以 [^ -~] 表示字符不在空格和 ~ 之间。所以不包括控制字符,这匹配非 ASCII 字符,并且是一个更便携但稍微不太准确的 [^\x00-\x7f] 版本。 \+ 表示 1 或更多 并且将使多字节字符在完整字符周围显示颜色,而不是散布在每个字节中,从而破坏多字节序列

关于bash - 如何使用 bash 工具搜索非 ASCII 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13596531/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com