gpt4 book ai didi

python - 获取 unicode 象形图的名称

转载 作者:行者123 更新时间:2023-11-30 23:08:35 24 4
gpt4 key购买 nike

我正在尝试分析包含如下 unicode 象形图的文本流:

💄 -> 128132 -> Lipstick
💅 -> 128133 -> Nail Polish
💋 -> 128139 -> Kiss Mark

我希望能够查找每个字符的名称,因此,例如,每当我遇到 💄 字形时,我都想将其替换为“UNICODE_LIPSTICK”等字母数字符号。

是否有一个数据文件列出了所有 unicode 字符的编号及其名称?我正在寻找某种映射(最好是易于导入的纯文本格式)。这样的数据集是否存在?

我实际上是用 Python 3 编程的,所以如果语言中内置了一些可以做到这一点的东西,那就更好了!

最佳答案

您可以使用unicodedata.name() function查找官方代码点名称:

>>> import unicodedata
>>> unicodedata.name(chr(128132))
'LIPSTICK'
>>> unicodedata.name(chr(128133))
'NAIL POLISH'
>>> unicodedata.name(chr(128139))
'KISS MARK'

关于python - 获取 unicode 象形图的名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31635600/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com