gpt4 book ai didi

javascript - String.match() for regex\s on chinese string 在 IE8 和 IE9/Chrome/Firefox/… 之间的工作方式不同

转载 作者:行者123 更新时间:2023-11-30 17:39:30 25 4
gpt4 key购买 nike

当我在IE8中使用正则表达式\s匹配汉字空白()时,它返回false,这意味着它是一个双字节字符。另一方面,在 IE9(或更高版本的 IE、Chrome、Firefox、Safari 等)中,它返回 true,这意味着 是一个单字节字符。实际上,它是一个双字节字符。

我想知道IE8的regex引擎和其他高版本浏览器的regex引擎有什么区别吗?这是什么?

代码如下。

function OneByteCharCheck(value) {
if (value.match(/^(?:[a-zA-Z0-9@\;\:\[\]\{\}\|\^\=\/\!\*\`\"\#\$\+\%\&\'\(\)\,\.\<\>\-\_\?\\\s()ァ-ン゙゚ 。「」、・ヲ~]*)*$/)) {
return true
}
return false;
}

最佳答案

差异是由于 IE8 及以下版本与许多 Web 标准的一致性很差,即使在其发布时也是如此。

运行我的 test pagebrowserstack显示 IE8 只能匹配 Unicode Space Character (Zs) 中的 17 个字符中的 1 个类别,而 IE9 成功匹配所有 17 个字符(包括 U+3000)。这很可能是由于 Microsoft 努力符合 IE9 及更高版本的许多 Web 标准。

即使在 IE8(2009 年 3 月)中,它的 JavaScript 引擎也只能匹配 1 个字符,可能是空格 (U+0020),这意味着它是 < strong>不甚至 ECMA-262 第 3 版 兼容(1999 年 12 月 发布),因为第 3 版规范明确列出了 U+00A0 NO-BREAK SPACE在 7.2 空白部分。虽然并非所有 Zs 类别代码点从一开始就被映射,但从 U+2000 到 U+200A、U+00A0 和 U+3000 的代码点已经映射到 Unicode 2.0(日期为 1996 年 7 月)。

解决方案

作为bobincethe comment 中提到, 最好列出所有字符而不是使用简写字符类表示法。这将确保新旧浏览器的行为一致。

附录

这是我的测试页面的源代码:

<!DOCTYPE html>
<html>
<meta charset="utf-8">
<body>
<script type="text/javascript">
var Zs = ['\u0020', '\u00a0', '\u1680', '\u2000', '\u2001',
'\u2002', '\u2003', '\u2004', '\u2005', '\u2006',
'\u2007', '\u2008', '\u2009', '\u200a', '\u202f',
'\u205f', '\u3000'];

var count = 0;
for (var i = 0; i < Zs.length; i++) {
count += /^\s$/.test(Zs[i]);
}

document.write("<h2>" + count + "/" + Zs.length + " in Unicode Zs category passed the test</h2>")
</script>
</body>
</html>

Windows 7 IE8 screenshot (by browserstack)
Windows 7 IE9 screenshot (by browserstack)

关于javascript - String.match() for regex\s on chinese string 在 IE8 和 IE9/Chrome/Firefox/… 之间的工作方式不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21371713/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com