gpt4 book ai didi

python - Lo 类别的基数

转载 作者:太空宇宙 更新时间:2023-11-04 01:33:44 27 4
gpt4 key购买 nike

我正在尝试找出 Unicode 类别的基数,如 Lo。看来我找不到关于那个的权威信息。例如。 Fileformat.info维护此类别中有 11788 个字符的 View ,Codepoints.net低至 122,而 Python 的 unicodedata,即使仅限于 Basic Plane,也可以提供高达 45301!:

In [219]: Lo=[unichr(c) for c in xrange(65536) 
if unicodedata.category(unichr(c)) == 'Lo']

In [220]: len(Lo)
Out[220]: 45301

谁能告诉我一个可靠的来源来解决这个问题?!

编辑:

Python 代码段中 len(Lo) 的结果取决于 UCD 的版本使用,因此在 Python 版本上。我的结果是使用 UCD 5.1 版的 Python 2.6,使用 UCD 5.2 的 Python 2.7 对相同的表达式产生 45877,而使用 UCD 6.0 的 Python 3.2 可能会产生另一个数字。

最佳答案

最终信息将是 Unicode standard本身。特别是,有关字符数据库的信息可用 here它提供有关 Unicode 字符数据库的信息。当前标准有11788个Lo类代码点。

关于python - Lo 类别的基数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11791804/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com