gpt4 book ai didi

Javascript toLowerCase 奇怪的行为

转载 作者:数据小太阳 更新时间:2023-10-29 04:18:19 26 4
gpt4 key购买 nike

我有一个读取推文并尝试匹配关键字的小应用程序,我注意到特定字符串的这种奇怪行为:

var text = "The Νіk​е D​un​k​ Ніgh ЅΒ 'Uglу Ѕwеаt​еr​' іѕ n​оw аvаіlаblе http://swoo.sh/IHVaTL";
var lowercase = text.toLowerCase()

现在小写的值为:

the νіk​е d​un​k​ ніgh ѕβ 'uglу ѕwеаt​еr​' іѕ n​оw аvаіlаblе http://swoo.sh/ihvatl

所以看起来字符串的格式很奇怪,我仔细检查了一些字母并发现:

text.charAt(4)
>"N"
text.charCodeAt(5)
>925
'N'.charCodeAt(0)
>78

所以即使它看起来像一个普通的N,它所关联的unicode对应的也是

0925 थ DEVANAGARI LETTER THA

根据unicode chart

所以我有点困惑这是怎么发生的,以及是否有办法“转换”成假定的真实字母

最佳答案

有一个名为 unidecode 的 python 库我以前用 python 解决过这个问题,它基本上将 unicode“扁平化”为 ascii。

快速谷歌显示一个 similar库可用于 JavaScript。

关于Javascript toLowerCase 奇怪的行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20601465/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com