gpt4 book ai didi

python - 获取 143.859 Unicode 标准版本 13.0.0 字符的列表

转载 作者:行者123 更新时间:2023-12-05 03:38:23 25 4
gpt4 key购买 nike

是否可以获得13.0.0版本的Unicode中包含的所有143,859个字符的列表?我试图在 python 中打印这 143,859 个字符,但无法找到所有字符的完整列表。

最佳答案

要获得 143,859 个字符的列表,您必须 exclude the same categories the unicode consortium has excluded以便得出该计数。

import sys
from unicodedata import category, unidata_version

chars = []
for i in range(sys.maxunicode + 1):
c = chr(i)
cat = category(c)
if cat == "Cc": # control characters
continue
if cat == "Co": # private use
continue
if cat == "Cs": # surrogates
continue
if cat == "Cn": # noncharacter or reserved
continue
chars.append(c)

print(f"Number of characters in Unicode v{unidata_version}: {len(chars):,}")

我机器上的输出:

Number of characters in Unicode v13.0.0: 143,859

关于python - 获取 143.859 Unicode 标准版本 13.0.0 字符的列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68991785/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com