gpt4 book ai didi

internationalization - ICU 的整理器假设 "a"和 "ą"是相同的

转载 作者:行者123 更新时间:2023-12-02 00:21:43 25 4
gpt4 key购买 nike

我正在使用立陶宛语 ( lt_LT) 语言的 ICU。该语言的字母表如下:a ą b c č d e ę ė <...> v z ž

但是,在排序时,ICU 的整理器假定,例如,aą (a 与 ogonek)是等价的,因此立陶宛语单词列表按如下方式排序:

a, ą, ab, aba, abadas, <...>, b, ba, <...>`

当预期结果是:

a, ab, aba, abadas, <...>, ą, <...>, b, ba, <...>

其他“重音”字母( e - ę - ė , z - ž 等)也是如此

更具体的测试用例:运行 source/samples/coll/coll -locale lt_LT -source ą -target aa决定source is less than target当情况并非如此时(如果需要,请参阅 coll.cpp)。

这种行为是预期的吗?这是错误还是功能?如果是这样,我该如何防止 ICU 的整理器将“相似”字母对齐在一起?

最佳答案

这些字母在 CLDR 剪裁中被列为次要差异,因此它们将排序 like so .如果这是错误的,请将其提交至 CLDR ,不是 ICU 问题。 Mimer同意。

关于internationalization - ICU 的整理器假设 "a"和 "ą"是相同的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10668574/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com