gpt4 book ai didi

用于验证印度语言字符的 Java REGEX 代码不起作用?

转载 作者:搜寻专家 更新时间:2023-10-30 21:33:30 24 4
gpt4 key购买 nike

为什么以下代码对印度语言不起作用(结果为 false)?

System.out.println(Charset.forName("UTF-8").encode("అనువాద")
.asCharBuffer().toString().matches("\\p{L}+"));

System.out.println(Charset.forName("UTF-8").encode("स्वागत")
.asCharBuffer().toString().matches("\\p{L}+"));

System.out.println(Charset.forName("UTF-8").encode("நல்வரவு")
.asCharBuffer().toString().matches("\\p{L}+"));

以上所有代码都返回 false。这个正则表达式有什么问题?如何验证世界上任何一个 unicode 字符?

最佳答案

\p{Letter} 只捕获字母,但您还需要标记,您可以使用 \p{Mark} 捕获标记。

System.out.println("स्वागत".matches("[\\pL\\pM]+"));

关于用于验证印度语言字符的 Java REGEX 代码不起作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16335402/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com