gpt4 book ai didi

php - 第一句正则表达式

转载 作者:可可西里 更新时间:2023-10-31 23:59:49 26 4
gpt4 key购买 nike

我正在使用正则表达式(与 php/perl 兼容)从某些文本中获取第一句。我意识到如果涵盖所有案例,这可能会变得巨大,但只是在目前“足够好”的事情之后。任何人为此得到现成的东西吗?

最佳答案

最终,您需要的是自然语言解析,这是极其困难的,而且仅靠正则表达式(甚至是增强型 PCRE 表达式)可能是不可能的。考虑这句话:

So much for Mr. Regex and his sentence matching.

到目前为止给出的每个答案都会将其解析为两个句子,这甚至算不上极端情况 - 可以很合理地想象一段以“亲爱的亚当斯先生:”或类似内容开头的文本.您可以添加 lookbehinds 来检查标点符号之前的单词是什么,但这将变得无法维护,因为您必须检查每个可能的缩写。您必须检查 Mr. and e.g.和合作。和 St. 以及许多您永远不会想到的其他人。一段时间后,您可能会得到一个“相当不错”的实用解决方案,但它会很丑陋,总有一天会失败。

关于php - 第一句正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1569091/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com