gpt4 book ai didi

Java正则表达式检测句子结尾但忽略(num)(句点),例如15

转载 作者:行者123 更新时间:2023-11-30 05:19:44 25 4
gpt4 key购买 nike

试图找到一个好的正则表达式来检测java中的句子结尾。主要问题是,如果有数字然后句点,它会将其检测为句子结尾(请参阅演示链接)。但就我而言,我希望它不将其识别为句子结尾,尽管在某些情况下可能是这样。我在文档中更常见的是节标题,如下所示:

  12.  the end of the world   13. world didnt end  14. nope it did

就我而言,它将许多简单的标题列表分成我不想要的句子。

已发布解决方案的附加问题 here :

建议的解决方案是: [!?.]+(?=$|\s)

See demo:  http://regex101.com/r/lS5tT3/15

问题是,如果有一个章节标题,例如 15.,那么它会错误地将其视为句子结尾。在演示中尝试此文本,您将在第一句话中看到问题:

   This is the f!!rst *15.* the best sentence! Is this the second one? The third 32.5 sentence is here... And the fourth one!!

如果有任何正则表达式高手可以帮助逻辑地添加它不是一个句子结尾如果句点空格而是前面有一个数字,那将非常有帮助

最佳答案

此正则表达式适用于一些缩写并正确识别句子结束标记。不幸的是,对于 java string.split 我需要这个函数的反函数......

 ([!?]+(?=$|\s))|((?<![\d])(?<!etc)(?<!Mr)(?<!mr)(?<!i.e)(?<!Dr)(?<!dr)(?<!Mrs)(?<!mrs)(?<![ A-Z])(?<!Ms)(?<!ms)(?<!Phd)(?<!u\.s)(?<!U\.S)(?<!\.)[.]{1}(?=$|\s))|

关于Java正则表达式检测句子结尾但忽略(num)(句点),例如15,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59759802/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com