gpt4 book ai didi

java - 正则表达式将字符串拆分为句子

转载 作者:行者123 更新时间:2023-12-04 20:11:00 26 4
gpt4 key购买 nike

我需要拆分包含以下句子的字符串:

"this is a sentence. this is another. Rawlings, G. stated foo and bar." 

进入

["this is a sentence.", "this is another.", "Rawlings, G. stated foo and bar."] 

使用正则表达式。

我找到的其他解决方案将第三句拆分为 "Rawlings, G.""stated foo and bar."这不是我想要的。

最佳答案

正则表达式一般不能解决这个问题。

你需要一个句子检测算法,OpenNLP有一个

使用起来很简单:

String sentences[] = sentenceDetector.sentDetect(yourString);

并且处理了很多棘手的案例

  • “小沃尔特·怀特有钱”
  • “粉红先生不给小费”

关于java - 正则表达式将字符串拆分为句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27250786/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com