gpt4 book ai didi

java - 正则表达式在每个句点后分割一个段落,但在缩写后不分割

转载 作者:太空宇宙 更新时间:2023-11-04 15:15:40 24 4
gpt4 key购买 nike

我需要将一个段落分成句子。所以这意味着在每个句号之后将其分开,但我还必须考虑该句子可以包含缩写,例如 Anniv。利姆诺尔。公司我使用lookbehind创建了一个正则表达式来匹配句点之前的任何缩写。我按照缩写列表动态创建正则表达式,如下所示:

    String regex = "(?<!abbrev1)(?<!abbrev2)\\.";
//abbrev 1 and abbrev 2 are just examples the regex I use is much longer
//Then I split the paragraph

paragraph.split(regex);

这可行,但问题是当我有像 U.S.A. OR R.A.F. 这样的缩写时,在这种情况下它不会

如有任何帮助,我们将不胜感激编辑:我想出了这个 http://regexr.com?37rb3

但是 id 在 Java 中不起作用,你知道为什么它不起作用吗?

最佳答案

我建议您在缩写中包含句点,而不是单独表示它们。或者,您可以使用当前的正则表达式样式将 U.S.A. 表示为 U.S.A

关于java - 正则表达式在每个句点后分割一个段落,但在缩写后不分割,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20872313/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com