gpt4 book ai didi

regex - 从文本字符串中提取第一个句子

转载 作者:行者123 更新时间:2023-12-02 05:37:41 25 4
gpt4 key购买 nike

是否有一个简单的技巧可以隔离大字符串中的第一个句子? (也许使用正则表达式。)

搜索第一个句号“.”不起作用,如“U.S.A.”等缩写词会把事情搞砸的。

(可能没有正确答案。)

最佳答案

没有。没有简单的技巧。为了正确地做到这一点,您需要对文本进行语法分析。没有人能做到这一点。至少现在还没有。至少不是 100% 的时候。主要是因为它还需要对文本进行语义分析。你看,与在学校教你语法的语言学家的想法相反,组成句子的内容很难概括为计算机在不理解文本的情况下可以遵循的一组规则。

在接下来的几年里查找计算语言学。也许到时候会有捷径?

但你可以接近。

我可能会尝试查找第一个句点、问号或感叹号,后跟空格。

/^(.*?)[.?!]\s/

((.*?) 是一个非贪婪的正则表达式,以确保您确实只找到第一句。

关于regex - 从文本字符串中提取第一个句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3788220/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com