gpt4 book ai didi

java - 句子构成 : Punctuation checks in java

转载 作者:行者123 更新时间:2023-11-30 04:23:19 26 4
gpt4 key购买 nike

我想检查句子结构的质量。具体来说,我想看看最终用户是否在标点符号后输入空格。我也可以使用 NLP 库或简单的 java 正则表达式解决方案。

例如:

  1. “嗨,我叫汤姆·克鲁斯。我喜欢电影”
  2. “嗨,我叫汤姆·克鲁斯。我喜欢电影”
  3. “嗨,我叫汤姆·克鲁斯。我喜欢电影”

句子 1 是完美的,句子 2 很糟糕,因为它有 1 个标点符号,后面没有空格,而句子 3 是最糟糕的,因为没有一个标点符号后面有空格。

你能建议一个java方法来解决这个问题吗?我尝试了 languagetool API,但没有成功。

最佳答案

为什么不尝试模式和 Unicode 类别呢?

例如:

Pattern pattern = Pattern.compile("\\p{P} ");
Matcher matcher = pattern.matcher("Hi, my name is Tom Cruise. I like movies");
while (matcher.find()) {
System.out.println(matcher.group());
}

此处的模式搜索任何后跟空格的标点符号。输出将是:

, 
.

(注意逗号和点后面的空格)

您可以通过指定哪些确切的标点符号后面可以跟空格来优化您的模式。

最后,为了检查相反的情况(标点符号后跟空格):

Pattern otherPattern = Pattern.compile("\\p{P}\\S");

关于java - 句子构成 : Punctuation checks in java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16459061/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com