gpt4 book ai didi

regex - 正则表达式匹配以特殊字符结尾的句子,如 . ! ?但忽略像 George W. Bush,Mr. 这样的话。 ETC

转载 作者:行者123 更新时间:2023-12-02 17:44:42 25 4
gpt4 key购买 nike

我正在寻找一个正则表达式来解析一个文本文件,其中的句子以特殊字符结尾,例如 .!? 但忽略乔治·W·布什、霍普金斯先生、紫罗兰夫人等词。

我尝试了 (?!Mr|Mrs|[A-Za-z]\.\s)\S.+?[.!?](?=\s+|$) 但是这似乎不起作用。

最佳答案

英语绝对是一种非常规语言。我认为正则表达式是不够的:您可能需要一个完整的分词器,再加上某种机器学习,可能是马尔可夫模型,来检测一个句子在哪里结束,下一个句子在哪里开始。即便如此,它也只是一种启发式方法——因为人类语言的使用是草率的,所以可能永远不可能有精确的解决方案。

关于regex - 正则表达式匹配以特殊字符结尾的句子,如 . ! ?但忽略像 George W. Bush,Mr. 这样的话。 ETC,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16580646/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com