gpt4 book ai didi

unix - iconv unicode未知输入格式

转载 作者:行者123 更新时间:2023-12-04 05:08:44 24 4
gpt4 key购买 nike

我有一个在Unix下描述为的文件:

$file xxx.csv 
xxx.csv: UTF-8 Unicode text, with very long lines

less/ vi查看它会导致某些特殊字符(ßÄ°...)不可读(├╝); Windows也不会显示它;将其直接导入到数据库中只会将特殊字符更改为其他一些特殊字符(+ä,+ñ,...)。

我现在想使用iconv将其转换为“默认可读”编码。
当我尝试使用iconv进行转换时
$iconv -f UTF-8 -t ISO-8859-1 xxx.csv > yyy.csv
iconv: illegal input sequence at position 1234

使用UNICODE作为输入并使用UTF-8作为输出将返回相同的消息

我猜该文件是以某种我不知道的其他格式编码的-我该如何找出哪种格式才能将其转换为“普遍”可读的格式...

最佳答案

仅当您的UTF-8文本仅具有可以用ISO-8859-1表示的字符时,才可以从UTF-8转换为ISO-8859-1。如果不是这种情况,则应指定需要对这些字符进行什么处理,或者忽略它们(//IGNORE)或近似它们(//TRANSLIT)。尝试以下两种方法之一:

iconv -f UTF-8 -t ISO-8859-1//IGNORE --output=outfile.csv inputfile.csv
iconv -f UTF-8 -t ISO-8859-1//TRANSLIT --output=outfile.csv inputfile.csv

在大多数情况下,我认为近似是最好的解决方案,例如映射不带重音符号的重音符号,带欧元符号的欧元符号等...

关于unix - iconv unicode未知输入格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7688464/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com