gpt4 book ai didi

linux - 如何以编程方式更改文件编码 linux?

转载 作者:太空狗 更新时间:2023-10-29 11:29:22 28 4
gpt4 key购买 nike

是否有任何程序可以通过编程将文件编码更改为 UTF-8。我有 1000 个文件,我想在 Linux 中以 UTF-8 格式保存它们。

谢谢。

最佳答案

iconv会处理它,像这样使用它:

iconv -f ISO88591 -t UTF8 in.txt out.txt

其中 88591latin1 的编码,最常见的 8 位编码之一,可能(也可能不是)您的输入编码。

如果您不知道输入字符集,you can detect it使用标准的 file 命令或基于 python 的 chardet .例如:

iconv -f $(file -bi myfile.txt | sed -e 's/.*[ ]charset=//') -t UTF8 in.txt out.txt

你可能想做一些比这个衬里更健壮的事情,比如在编码未知时不要处理文件。

从这里开始,要遍历多个文件,您可以执行类似的操作

find . -iname *.txt -exec iconv -f ISO88591 -t UTF8 {} {} \;

我没有检查这个,所以你可能想用谷歌搜索 iconv 并找到,在 SO 上阅读它们,或者只是阅读它们的手册页。

关于linux - 如何以编程方式更改文件编码 linux?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25077335/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com