gpt4 book ai didi

python - 格式化 Unicode 的 Unicode 表示?

转载 作者:太空宇宙 更新时间:2023-11-03 13:34:43 25 4
gpt4 key购买 nike

我在理解 unicode 表达式到各自字符的翻译时遇到了一些困难。我一直在查看 unicode 规范,并且遇到了格式如下的各种字符串 U+1F600。据我所知,似乎没有内置函数知道如何将这些字符串转换为 Python 的正确格式,例如 \U0001F600

在我的程序中,我制作了一个小的正则表达式,它将找到这些 U\+.{5} 模式并将 U+ 替换为 \U000。但是,我发现这种语法对于所有 unicode 字符都不相同,例如实际上应该从 U+200D 转换为 \u200D 的零宽度连接

因为我不知道正确的 unicode 转义序列的每一种变体,处理这种情况的最佳方法是什么?是我只能检查有限数量的这些特殊字符,还是我完全以错误的方式进行检查?

Python 版本为 2.7。

最佳答案

我认为您最可靠的方法是将数字解析为整数,然后使用 unichr 查找该代码点:

unichr(0x1f600)  # or: unichr(int('1f600', 16))

注意:在 Python 3 上,它只是 chr

关于python - 格式化 Unicode 的 Unicode 表示?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41731327/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com