gpt4 book ai didi

linux curl 另存为utf-8

转载 作者:IT王子 更新时间:2023-10-28 23:59:10 24 4
gpt4 key购买 nike

尝试使用 linux curl 从 url 下载 xml 文件。

很确定 xml 是用 UTF-8 编码的,

怀疑 curl -o 没有保存为 UTF-8。

有没有办法用 curl 强制保存为 UTF-8?


谢谢你的建议,我发现了什么:

因为 xml 提要是动态的,它并不总是包含任何 utf-8 字符。有时它在整个内容中根本没有 utf-8 字符,即使它在 xml 编码和 header 内容类型中设置为 utf-8:charset=utf-8。当它至少包含一个utf-8字符时,它将被保存为utf-8。

发生这种情况时,curl 不会下载为 utf-8,这是有道理的,因为没有 utf-8 字符,为什么需要存储为 utf-8。

这该死的棘手,一些验证器必须针对 utf-8 有效,因此我仍然需要一个解决方案来强制它为 utf8,因为默认情况下我的所有 xml shld 都采用 utf8 编码。

尝试使用 iconv f iso8859-1 utf-8 的建议不适用于这种情况,因为我怀疑它也不在 iso8859-1 中。

仍然需要更好的解决方案。

最佳答案

curl 不会对其下载的文件进行任何转换。如果 HTTP 服务器为您提供另一种编码(例如 ISO8859-1)的 XML,他的 curl 方法也会将其保存到磁盘。

要解决您的问题,您可以使用“iconv”,如下所示:

curl URL | iconv -f iso8859-1 -t utf-8 > output.xml

希望这对您有所帮助。

关于linux curl 另存为utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10172327/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com