gpt4 book ai didi

javascript - 正则表达式:如何找到以 Ä,Ö,Ü ... 开头的单词?

转载 作者:行者123 更新时间:2023-11-30 17:14:04 25 4
gpt4 key购买 nike

我在文本中搜索单词:

var newWords = data.match(/\b[^\s\d,-.:!?{}\"“\[\]']+/g);

除了以 Ä、Ö、Ü 等字母开头的单词外,这是可行的,这在德语中是完全可行的。

我真正想做的,就是把上面的搜索写成这样

var newWords = data.match(/\b[^\W\d]+/g);

但这让我完全没有 ä, ö, ü 的话。 ß 也不见了。

有好的解决方案吗?

最佳答案

我建议使用简单的解决方案

var newWords = data.match(/[\w\xc0-\xd6\xd8-\xf6\xf8-\xff]+/g);

这匹配任何情况下仅由字母 A-Z 组成的字符串,以及代码页 ISO/IEC 8859-1 中代码值为 192 到 255 的所有字母。这类似于 Windows-1252除了 multiplication signobelus只要 data 字符串只包含北美和西欧文本。

用表达式

var newWords = data.match(/[\w\u00c0-\u00d6\u00d8-\u00f6\u00f8-\u00ff]+/g);

ISO/IEC 8859-1 和 Windows-1252 中特殊语言特定字母的 Unicode 值被明确指定,因此表达式忽略其他语言(如东欧语言)的其他字母。

关于javascript - 正则表达式:如何找到以 Ä,Ö,Ü ... 开头的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26453939/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com