gpt4 book ai didi

java - Unicode block : get alphabet of every language [Java]

转载 作者:行者123 更新时间:2023-12-01 19:01:41 25 4
gpt4 key购买 nike

我已经搜索了很多,希望有人能帮助我。我想获得 Java 中每种语言的 Unicode block 。到目前为止我发现的是:

  • 字符.UnicodeBlock.ARABIC;字符.UnicodeBlock.西里尔文;
  • Character.UnicodeBlock.LATIN_1_SUPPLMENT; ....

但这还不够。我还想知道,德语、法语、俄语字母表中有哪些字母。我只能知道它们对应于拉丁文或西里尔文,但不对应于语言特定的字母,如 this .

最佳答案

查看ICU类(class)LocaleData 。它允许按区域设置访问 CLDR 元素,例如 exemplarCharacters。

请注意,exemplarCharacters 的定义相当模糊(语言中使用的字符的概念本质上也是模糊的),因此它的值尚未在坚实的基础上定义,并且在那里做出的许多选择相当模糊可以说。但那里的数据可能仍然是我们总体上最好的基础。

另请注意,在此上下文中,Unicode block 是相当粗糙的单位。例如,Latin 1 Supplement block 包含许多语言中使用的字符,但没有一种语言使用其中的所有字母。

关于java - Unicode block : get alphabet of every language [Java],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12049495/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com