gpt4 book ai didi

python - 在度数符号前获取一个字符

转载 作者:太空宇宙 更新时间:2023-11-03 14:27:20 24 4
gpt4 key购买 nike

我正在尝试将度数符号连接到一个字符串,以便我可以将它写入 word 文档。我试过这样做。

degreeChar = u'\N{DEGREE SIGN}'
print degreeChar.encode('UTF-8')

我从这里得到的输出是 °,我不确定为什么 会出现。我究竟做错了什么?很沮丧!

谢谢。

最佳答案

当你这样做时:

>>> degreeChar = u'\N{DEGREE SIGN}'

degreeChar 是一个单字符的 Unicode 字符串——特别是 u'°':

>>> len(degreeChar)
1
>>> ord(degreeChar)
176

当你将它编码为 UTF-8 时,你会得到一个 2 字节的 UTF-8 字节字符串:

>>> dc = degreeChar.encode('UTF-8')
>>> len(dc)
2
>>> ord(dc[0]), ord(dc[1])
(194, 176)

作为UTF-8,那对字节表示u'°'。但是,例如 Latin-1 或 cp1252,完全相同的一对字节表示 u'°'。这就是不同编码的全部要点——相同的字节序列在不同的编码中意味着不同的东西。查看详情:

>>> dc2 = dc.decode('latin-1')
>>> len(dc2)
2
>>> ord(dc2[0]), ord(dc2[1])
(194, 176)

那么,如果您尝试将 UTF-8 字符串打印到 cp1252 终端,会发生什么情况?或者将其保存为一个二进制文件,然后将其作为 cp1252 文本文件打开?好吧,您当然会得到 °


那么,你是如何解决这个问题的?

好吧,只是不要尝试将 UTF-8 编码的字节打印到 cp1252 终端!如果 Python 已成功猜出您的终端编码,则首先将其打印为 Unicode 字符串:

>>> print u'°'
°

如果不是,您要么需要修复您的配置,以便 Python 确实 正确猜测您的终端编码(在大多数 *nix 系统上很容易,在 Windows 上则不是那么多……),或者手动指定它,或者只编码为正确的编码而不是错误的编码:

>>> print u'°'.encode('cp1252')
°

关于python - 在度数符号前获取一个字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18065510/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com