gpt4 book ai didi

python - 如何将表示 UTF-8 字符的 int 转换为 Unicode 代码点?

转载 作者:太空狗 更新时间:2023-10-29 21:05:39 33 4
gpt4 key购买 nike

让我们使用字符 Latin Capital Letter a with Ogonek (U+0104)举个例子。

我有一个代表其 UTF-8 编码形式的 int:

my_int = 0xC484
# Decimal: `50308`
# Binary: `0b1100010010000100`

如果使用 unichr 函数我得到:\uC484 (U+C484)

但是,我需要它来输出:Ą

如何将 my_int 转换为 Unicode 代码点?

最佳答案

将整数0xC484转换为字节串'\xc4\x84'(Unicode字符Ą的UTF-8表示) , 你可以使用 struct.pack() :

>>> import struct
>>> struct.pack(">H", 0xC484)
'\xc4\x84'

... format string 中的 >代表big-endianH代表unsigned short int

一旦你有了 UTF-8 字节串,你就可以像往常一样将它解码为 Unicode:

>>> struct.pack(">H", 0xC484).decode("utf8")
u'\u0104'

>>> print struct.pack(">H", 0xC484).decode("utf8")
Ą

关于python - 如何将表示 UTF-8 字符的 int 转换为 Unicode 代码点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29273997/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com