gpt4 book ai didi

javascript - 如何在JavaScript中匹配所有4字节UTF-8字符?

转载 作者:行者123 更新时间:2023-11-28 15:02:56 26 4
gpt4 key购买 nike

我尝试了很多变体,例如 /[\u0FFF-\uFFFF]/,但它从未像我预期的那样对我有用。

之所以问这个问题,是因为我使用的mysql版本不支持这些字符,当有表情符号之类的东西时就会 chop 字符串。更新mysql到新版本暂时不是解决方案。

最佳答案

根据this ,码点 U+10000 到 U+10FFFF 用 4 个字节进行编码。

有了足够新的 Node 版本(v6,也许还有 v5,但我没有测试),您可以在正则表达式中使用它们,如下所示(注意 u 标志):

const str = 'hello world😈!';

console.log( /[\u{10000}-\u{10FFFF}]/u.test(str) ); // true
console.log( str.replace(/[\u{10000}-\u{10FFFF}]/gu, '') ); // `hello world!`

(更多信息 here )

关于javascript - 如何在JavaScript中匹配所有4字节UTF-8字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40259460/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com