gpt4 book ai didi

java Collat​​ionKey排序错误

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:28:23 25 4
gpt4 key购买 nike

我在比较字符串时遇到问题。我想像这样比较两个“éd”和“ef”法语文本

Collator localeSpecificCollator = Collator.getInstance(Locale.FRANCE);
CollationKey a = localeSpecificCollator.getCollationKey("éd");
CollationKey b = localeSpecificCollator.getCollationKey("ef");
System.out.println(a.compareTo(b));

这将打印 -1,但在法语字母表中 e 位于 é 之前。但是当我们像这样只比较 eé

Collator localeSpecificCollator = Collator.getInstance(Locale.FRANCE);
CollationKey a = localeSpecificCollator.getCollationKey("é");
CollationKey b = localeSpecificCollator.getCollationKey("e");
System.out.println(a.compareTo(b));

结果是 1。你能告诉我们代码的第一部分有什么问题吗?

最佳答案

这似乎是预期的行为,这似乎也是法语中按字母顺序排序的正确方法。

Android javadoc给出了它为什么会这样的提示 - 我想 android 中的实现细节与标准 JDK 相似,如果不相同的话:

A tertiary difference is ignored when there is a primary or secondary difference anywhere in the strings.

换句话说,因为您的 2 个字符串可以通过仅查看主要差异(不包括重音符号)来排序,所以整理器不会检查其他差异。

它似乎符合 Unicode Collation Algorithm (UCA) :

Accent differences are typically ignored, if the base letters differ.

根据wikipedia article on "ordre alphabetique",这似乎也是法语中按字母顺序排序的正确方法。 :

En première analyse, les caractères accentués, de même que les majuscules, ont le même rang alphabétique que le caractère fondamental
Si plusieurs mots ont le même rang alphabétique, on tâche de les distinguer entre eux grâce aux majuscules et aux accents (pour le e, on a l'ordre e, é, è, ê, ë)

在英语中:该顺序最初会忽略重音和大小写 - 如果 2 个单词不能以这种方式排序,则会考虑重音和大小写。

关于java Collat​​ionKey排序错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11899516/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com