gpt4 book ai didi

java - 如何制作一个匹配任何语言单词的java正则表达式

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:12:44 24 4
gpt4 key购买 nike

要匹配英文单词,我会使用模式 [a-zA-Z]+

有什么方法可以编写一个正则表达式来匹配任何语言的单词吗?即使单词包含 ščžé... 之类的字符也是如此。我不知道世界上可能存在哪些字符,所以我认为纯 [a-zA-Zščžé]+ 不够......

这个表达式有没有更好的写法?

最佳答案

根据Pattern javadoc , \p{L}+ 应该匹配一系列 Unicode 字母(即在 Unicode 中具有类别 L 的字符)。这可能是最广泛的定义,尽管您可能想查看 unicode categories list决定是否要添加其他类别(例如,有一个名为“数字字母”的类别)。

关于java - 如何制作一个匹配任何语言单词的java正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4448687/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com