gpt4 book ai didi

unicode - Unicode 字母字符列表

转载 作者:行者123 更新时间:2023-12-04 16:32:30 28 4
gpt4 key购买 nike

我需要具有属性 Alphabetic 的 Unicode 字符范围列表如 http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic 中所定义.但是,无论我如何搜索它们,我都无法在 Unicode 字符数据库中找到它们。有人可以提供它们的列表或仅提供具有指定 Unicode 属性的字符的搜索工具吗?

最佳答案

Unicode 字符数据库包含发行版中的所有文本文件。它不仅仅是很久以前的单个文件。

Alphabetic 属性是派生属性。

您真的不想为此使用代码点范围。您想正确使用该属性。那是因为它们太多了。使用 unichars script ,我们了解到仅在Basic Multilingual Plane就有一万多个不是 数韩文或韩文:

$ unichars '\p{Alphabetic}' | wc -l
10052

如果我们包括其他 16 个星体位面,现在我们是一万四千个:
$ unichars -a '\p{Alphabetic}' | wc -l
14736

如果我们包括 Han 和 Hangul(实际上 Alphabetic 属性确实如此),我们只会炸毁十万个代码点:
$ unichars -ua '\p{Alphabetic}' | wc -l
101539

我希望你能看到你这样做 不是 想要使用代码点范围专门枚举这些。在那条路上是疯狂的。

顺便说一句,如果你找到了 unichars script有用,
您可能还喜欢 uniprops script或许还有 uninames script .

关于unicode - Unicode 字母字符列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4843347/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com