gpt4 book ai didi

java - 如何在 Java 中使用正则表达式捕获希伯来语?

转载 作者:搜寻专家 更新时间:2023-11-01 00:52:20 25 4
gpt4 key购买 nike

我正在尝试使用以下正则表达式捕捉一段希伯来语文本(来源是新闻网站上的评论):

[\u0590-\u05FF \\p{Graph} \\s]+

它适用于大多数评论,但会遗漏一些评论。

我已尝试对此进行调试,但似乎有一个希伯来字母与模式不匹配。

当我提取这封信并打印它的整数值时,它似乎是正确的,但正则表达式仍然没有捕捉到它...

想法?

最佳答案

使用 \p{InHebrew} 而不是 \u0590-\u05FF

在语义上更正确

您还需要匹配标点符号、数字(至少是世界通用的数字)和不同类型的空格。我不知道什么是 \p{Graph} 也不知道是否有特定于希伯来语的标点符号,但您似乎漏掉了一些部分。

关于java - 如何在 Java 中使用正则表达式捕获希伯来语?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8987119/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com