- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
今天,我偶然发现了 JavaScript/ECMAScript 国际化 API 的一个奇怪问题,我无法在任何地方找到合适的解释。比较两个特定字符时我得到不同的结果 - 正斜杠 (/
) 和下划线 (_
) 字符使用:
Intl.Collator.prototype.compare()
方法// Vanilla JavaScript comparator
const cmp = (a, b) => a < b ? -1 : a > b ? 1 : 0;
console.log(cmp('/', '_'));
// Output: -1
// When sorting
const result = ['/', '_'].sort(cmp);
console.log(result);
// Output: ['/', '_']
Intl.Collator.prototype.compare()
方法const collator = new Intl.Collator('en', {
sensitivity: 'base',
numeric: true
});
console.log(collator.compare('/', '_'));
// Output: 1
// When sorting
const result = ['/', '_'].sort(collator.compare);
console.log(result);
// Output: ['_', '/']
为什么这两种技术会产生不同的结果?这是 ECMAScript 实现中的错误吗?我在这里遗漏/未能理解什么?是否有其他此类字符组合会针对英语 (en
) 语言/区域设置产生不同的结果?
正如@t-j-crowder 指出的那样,将所有“ASCII”替换为“UTF-16”。
最佳答案
当您使用 <
时和 >
在字符串上,它们根据 UTF-16 代码单元值进行比较(不是 ASCII,但 ASCII 与许多常见字符的这些值重叠)。委婉地说,这是有问题的。例如,问法国人是否 "z" < "é"
应该真的是真的(表明 z
在 é
之前):
console.log("z" < "é"); // true?!?!
当您使用 Intl.Collator.prototype.compare
时,它根据您提供的选项为您的语言环境使用适当的排序规则(松散地排序)。在许多情况下,这可能与 UTF-16 代码单元值的结果不同。例如,即使在 en
中语言环境,Collator
返回 z
更合理的结果之后 é
:
console.log(new Intl.Collator("en").compare("z", "é")); // 1
_
和 /
特别是我不能具体告诉你为什么_
和 /
与 en
中的 UTF-16 代码单元有不同的顺序您正在使用的语言环境(以及我正在使用的语言环境),无论它是 en-US
, en-UK
, 或者是其他东西。但是发现它们在 ASCII 和 Unicode 之间的顺序不同也就不足为奇了。 (请记住,_
和 /
的 UTF-16 代码单元值来自它们的 ASCII 值。)
ASCII 的顺序是在 1960 年代早期精心设计的(a PDF 对此进行了精彩的详细介绍),但除了A-Z 和 0-9 的排序。 /
是 1963 年的原始 ASCII。_
直到 1967 年才被添加到可用位置之一,该位置的数值高于 /
.可能没有比 _
更重要的原因了。晚于/高于(数字)/
在 ASCII 中。
Unicode 的整理顺序是在 1990 年代(一直到今天)根据不同的目标(包括语言目标)、设计要求和设计约束精心设计的。据我所知(我不是 Unicode 专家),Unicode 的整理由 TR10 描述。和 TR35 的第 5 部分.我还没有找到为什么 _
的具体理由在 /
之前在根排序规则中(en
使用根排序规则)。我确定它在某处。我确实注意到它的一个方面似乎是按类别分组。 _
的类别是“连接标点符号”,而 /
的类别是“其他标点符号”。也许这与为什么 /
有关晚于 _
.
但根本的答案是:它们之所以不同,是因为 ASCII 的排序和 Unicode 整理是根据不同的约束和要求设计的。
关于javascript - 为什么 JavaScript `Intl.Collator.prototype.compare()` 方法会产生与特殊字符的传统 UTF-16 比较不同的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69405786/
我以一种特殊的方式收到以下错误。 The point at which the driver is attempting to click on the element was not scrolle
我有一些包含如下方法的编译库: public boolean foo(String userID) { Class ntSystemClass = Thread.currentThread()
假设我有下表 name | genre --------------------- book 1 | scifi book 2 | horror book 3
我正在用代码进行语言翻译。 self.title.text = [NSString stringWithFormat:NSLocalizedString(@"Q%ld", nil), (long)qu
我想这样做,但到目前为止,我所拥有的只是: print("Will you go out with me?") 我希望代码能够正常工作,以便人们可以回答“是/否”,如果回答是"is",则将返回一条消息
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: How can I decode html characters in c#? 我有来自 HTML 的字符,
我想在 JavaScript 中对以下形式的字符串执行 ucwords(),它应该返回 Test1_Test2_Test3。 我已经在 SO 上找到了一个 ucwords 函数,但它只需要空格作为新词
“任何长度的正数表示为数字字符数组,因此介于‘0’和‘9’之间。我们知道最重要的密码位于数组索引 0 的位置。 例子: - 号码是 10282 - 数组将是数字 = [1,0,2,8,2] 考虑到这一
我目前正在开发一个显示特殊 unicode 字符(例如 ꁴ)的应用 现在我遇到了在旧设备上无法显示这些符号的问题。我如何知道它是否适用于当前设备? 我是否必须为每个 SDK 版本创建一个虚拟 Andr
在 HTML、XML 和部分 DTD 中,有两种特殊的标记结构: 以感叹号开头的标签结束,例如 和 以问号开头的标签 ,例如 和 我的问题是,这些构造类型中的每一种是否都有不同的名称,或者我是否必
我目前正在用 python 构建一个 shell。shell 可以执行 python 文件,但我还需要添加使用 PIPE 的选项(例如“|”表示第一个命令的输出将是第二个命令的输入)。 为了做到这一点
我的 MVC 项目中的路由无法正常工作... 我希望我所有的 View 都在 Views > Shared 文件夹中,如下所示: Error.cshtml (default) Index.cshtml
我有一个函数: public static ImageIcon GetIconImageFromResource(String path){ URL url = ARMMain.class.g
好的,所以我想在我的 html 页面中包含下面的字符。看起来很简单,只是我找不到它们的 HTML 编码。 注意:我想在没有大小元素的情况下执行此操作,纯文本就可以了 ^_^。 干杯。 最佳答案 你可以
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 3 年前。
我是 C# 的新手,正在尝试使用 ASP.Net GridView(框架 3.5),当 gridView 文本包含以下内容时,我发现了一个大问题: ñ/Ñ/á/Á/é/É/í/Í/ó/Ó/ú/Ú or
在 Java 中,我尝试编写一个正则表达式来匹配特殊类型的 HTTP URL: http:///# 所以字符串有 4 段: 字符串文字:“http://”;那么 任意 1 个以上字符的字符串;那么 字
当我写查询时,我在表中有“to”列 SELECT to FROM mytable mysql_error 返回错误,如果将单词to插入``引号,即 SELECT `to` FROM mytable 查
我遇到了一个问题。事实上,我使用越南语文本,我想找到每个包含大写字母(大写字母)的单词。当我使用“re”模块时,我的函数 (temp) 没有捕捉到像“Đà”这样的词。另一种方法 (temp2) 是一次
在我的文本中,我想用一个空格替换以下特殊字符: symbols = ["`", "~", "!", "@", "#", "$", "%", "^", "&", "*", "(", ")", "_",
我是一名优秀的程序员,十分优秀!