gpt4 book ai didi

python - Unicode 字符名称的官方存储库

转载 作者:行者123 更新时间:2023-12-01 23:39:04 25 4
gpt4 key购买 nike

有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块 unicodedata ,如 List of unicode character names 中所述,或使用网站:https://unicode.org/charts/charindex.html但这里不完整,您必须打开并解析 PDF 才能找到名称。

但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样如果添加了新字符,列表就会更新,所以我正在寻找这些的初始来源名称,以机器可读的格式)。

我正在寻找一个仅包含 code pointname 的 CSV 或任何其他格式的列表:

code   character name
...
0102 LATIN CAPITAL LETTER A WITH BREVE
0103 LATIN SMALL LETTER A WITH BREVE
...

最佳答案

实际角色数据(包括角色名称和许多其他详细信息)的官方来源是 the Unicode Character Database .

可以通过http://www.unicode.org/Public/UCD/latest/ 访问最新版本的数据文件。 .

具体名字可以在the files NamesList.txt中找到.该文件的格式是 described here .

这是 CSV 格式的列表:https://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt

关于python - Unicode 字符名称的官方存储库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65158620/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com