gpt4 book ai didi

javascript - 在 JavaScript 中删除字符串中的重音符号/变音符号

转载 作者:IT老高 更新时间:2023-10-28 11:03:40 25 4
gpt4 key购买 nike

如何从字符串中删除重音字符?尤其是在 IE6 中,我有这样的东西:

accentsTidy = function(s){
var r=s.toLowerCase();
r = r.replace(new RegExp(/\s/g),"");
r = r.replace(new RegExp(/[àáâãäå]/g),"a");
r = r.replace(new RegExp(/æ/g),"ae");
r = r.replace(new RegExp(/ç/g),"c");
r = r.replace(new RegExp(/[èéêë]/g),"e");
r = r.replace(new RegExp(/[ìíîï]/g),"i");
r = r.replace(new RegExp(/ñ/g),"n");
r = r.replace(new RegExp(/[òóôõö]/g),"o");
r = r.replace(new RegExp(/œ/g),"oe");
r = r.replace(new RegExp(/[ùúûü]/g),"u");
r = r.replace(new RegExp(/[ýÿ]/g),"y");
r = r.replace(new RegExp(/\W/g),"");
return r;
};

但是 IE6 让我很烦,似乎它不喜欢我的正则表达式。

最佳答案

使用 ES2015/ES6 String.prototype.normalize() ,

const str = "Crème Brulée"
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")
> "Creme Brulee"

注意:如果您希望将 \uFB01(fi) 之类的内容标准化(到 fi),请使用 NFKD .

这里发生了两件事:

  1. normalize()ing to NFD Unicode 范式将组合字素分解为简单字素的组合。 Crèmeè 最终表示为 e + ̀
  2. 使用正则表达式 character class为了匹配 U+0300 → U+036F 范围,现在在全局范围内摆脱变音符号是微不足道的,Unicode 标准方便地将其分组为 Combining Diacritical Marks Unicode block 。

从 2021 年起,您还可以使用 Unicode property escapes :

str.normalize("NFD").replace(/\p{Diacritic}/gu, "")

性能测试见评论。

或者,如果您只想排序

Intl.Collator有足够的支持~95% right now ,也可以使用 polyfill here但我没有测试过。

const c = new Intl.Collator();
["creme brulee", "crème brulée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)
["crame brulai", "creme brulay", "creme bruléa", "creme brulee",
"crème brulée", "creme brulfé", "crome brouillé"]


["creme brulee", "crème brulée", "crame brulai", "crome brouillé"].sort((a,b) => a>b)
["crame brulai", "creme brulee", "crome brouillé", "crème brulée"]

关于javascript - 在 JavaScript 中删除字符串中的重音符号/变音符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/990904/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com