gpt4 book ai didi

Python写unicode字符错误

转载 作者:太空宇宙 更新时间:2023-11-04 01:40:39 25 4
gpt4 key购买 nike

我在让 Python 正确处理我的 unicode 文本时遇到了一些问题。

我把它归结为以下内容:

>>>print 'Høst'
Høst
>>>print u'Høst'
HÃ,st
>>>u = u'Høst'
>>>u
u'H\xf8st'

sys.stdout.encoding 说它使用的是 UTF-8,这很可能是第一个非 unicode 打印有效的原因。如果我只是需要打印一些东西,那就没问题了。但是,我正在从 SQL Server 中的数据构建一个 xml 文档,然后它确实需要是真正的 unicode。

我的数据看起来是非常好的 unicode 数据,u'H\xf8st' 在我看来是正确的,那么为什么 Python 一直将它输出为 'HÃ,st'?

最佳答案

ø 在 ISO-8859-1 中是 \xc3\xb8\xc3\xb8 也是 Unicode 00F8 字符 (ø) 的 UTF-8。也许您的控制台真的接受 ISO-8859-1 而不是 UTF-8 作为输入,这意味着 sys.stdout.encoding 是错误的。

关于Python写unicode字符错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5259362/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com