gpt4 book ai didi

character-encoding - 精通编码的 grep 替代品?

转载 作者:行者123 更新时间:2023-12-04 07:48:00 24 4
gpt4 key购买 nike

我很沮丧 grep 未能在我的 UTF-16 文档中找到像“你好”这样的词。

任何人都可以推荐一个尝试猜测文件编码然后正确处理它的 grep 版本吗?

最佳答案

确认为基于 perl 的 grep 替换?

你肯定想看看 ack .

它支持 Unicode 编码,基本上是 grep,但更好。

尝试使用 grep 匹配的 Unicode 语言环境

如果您使用的是 Linux、Unix 等,您可能需要将 LANG 变量更改为编码以匹配您的文档。

首先检查您的语言环境。这是我在 MacBook Pro 上的默认设置:

 $ locale 
LANG="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_CTYPE="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_ALL=

说,在 bash 下:
$ LANG="foo" grep 'gotta be found now' file.name

一些更持久的东西(小心这个):
$ export LANG="foo"
$ grep 'bar' mitz.vah

关于character-encoding - 精通编码的 grep 替代品?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/613087/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com