>> encoded_-6ren">
gpt4 book ai didi

Python2.7,unicode字符串的utf-32编码输出中的特殊字符是什么意思?

转载 作者:太空宇宙 更新时间:2023-11-03 10:58:23 31 4
gpt4 key购买 nike

我在玩弄 python 的 unicode 和编码方法,我使用特殊字符“‽”和一个汉字来查看不同的 utf 编码如何处理这些字符,并得到了这些输出。

>>> a = u"‽"
>>> encoded_a = a.encode('utf-32')
>>> a
u'\u203d'
>>> encoded_a
'\xff\xfe\x00\x00= \x00\x00'
>>> b = u"安"
>>> encoded_b = b.encode('utf-32')
>>> b
u'\u5b89'
>>> encoded_b
'\xff\xfe\x00\x00\x89[\x00\x00'

我的问题是编码结果中的等号和等号是什么意思?

最佳答案

"\xff\xfe\x00\x00" 是一个零宽度、非阻塞空格字符,因其用作字节顺序标记 (BOM) 而广为人知。打败我为什么 Python 将它插入到字符串中,但我确信有一种方法只请求给定字符串的编码,而不是其他程序将其识别为 UTF-32 的前缀。

接下来是字节 3d、20 和另外两个空值,它们代表小端字节顺序的代码点 203d。 3d,当解释为 ASCII 时,变成等号,20 变成空格字符。

关于Python2.7,unicode字符串的utf-32编码输出中的特殊字符是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37308565/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com