gpt4 book ai didi

character-encoding - 如何使用awk读取不同编码的文件?

转载 作者:行者123 更新时间:2023-12-01 16:19:43 25 4
gpt4 key购买 nike

如何在 Awk 中正确读取 UTF8 以外的编码文件?

我有一个希伯来语/Windows-1255 编码的文件。一个简单的 {print $0} awk 会打印诸如 � 之类的内容。我怎样才能让它正确读取?

最佳答案

awk 本身不支持处理不同的编码。它将遵循环境中指定的区域设置,但最好的选择是将输入转码为正确的编码,然后再将其交给 awk。

-f 是要转换的格式,-t 是目标格式,-c 会跳过任何会提前终止 iconv 操作的无效字符。当然--help会提供更多详细信息。

iconv -c -f cp1255 -t utf8 somefile | awk ...

关于character-encoding - 如何使用awk读取不同编码的文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1820659/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com