regex - 正则表达式匹配以特殊字符结尾的句子，如 . ! ？但忽略像 George W. Bush,Mr. 这样的话。 ETC-6ren

regex - 正则表达式匹配以特殊字符结尾的句子，如 . ! ？但忽略像 George W. Bush,Mr. 这样的话。 ETC

转载作者：行者123 更新时间：2023-12-02 17:44:42

25

4

我正在寻找一个正则表达式来解析一个文本文件，其中的句子以特殊字符结尾，例如 .、! 和 ? 但忽略乔治·W·布什、霍普金斯先生、紫罗兰夫人等词。

我尝试了 (?!Mr|Mrs|[A-Za-z]\.\s)\S.+?[.!?](?=\s+|$) 但是这似乎不起作用。

最佳答案

英语绝对是一种非常规语言。我认为正则表达式是不够的:您可能需要一个完整的分词器，再加上某种机器学习，可能是马尔可夫模型，来检测一个句子在哪里结束，下一个句子在哪里开始。即便如此，它也只是一种启发式方法——因为人类语言的使用是草率的，所以可能永远不可能有精确的解决方案。

关于regex - 正则表达式匹配以特殊字符结尾的句子，如 . ! ？但忽略像 George W. Bush,Mr. 这样的话。 ETC，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16580646/

25

4

0

文章推荐： jobs - 如何从 SGE 获取失败的作业列表

文章推荐： SQL 查询多张表的 Sum 和 Count

文章推荐： vim - 使用 vimscript 注释掉代码

c - 如果字符串数组在 C 中以 null 结尾，为什么其他数据类型的数组不以 null 结尾？
C 中的字符串或字符数组必须以空字符结尾才能知道它们在哪里结束。为什么相同的规则不适用于其他类型的数组？例如。计算机如何知道整数数组在哪里结束？整数/浮点数/ double 数组在内存中的表示方式有
vim - 如何在 Vim 中编辑文件，所有行都以 ^M 结尾，但最后一行以 ^M^J 结尾
我有一堆文件需要查看。这些文件中的所有行都以 ^M (\x0D) 结尾，但最后一行以 ^M^J (\x0D\x0A) 结尾。显然，Vim 将文件类型确定为 DOS，效果是文件的整个内容是显示在一行
ruby - 这段 Ruby 代码的作用是什么？ : def self. 元类；类<< self ；自己;结尾;结尾
以下是来自 Why's Poignant Guide to Ruby Chapter 6 的 Ruby 代码片段，他试图在 Ruby 中演示元编程: # Get a metaclass for thi
检查目录路径以 "."、 ".."结尾
我有一个编程问题，希望有人能帮我解决。我正在尝试为一项工作任务学习 C 编程，我为自己设定了一个小项目，其中包括读取文件树，其中包括获取有关每个文件的信息的所有子目录。我遇到的问题是我的程序不会忽略
react高效高质量搭建后台系统系列——结尾
其他章节请看： react 高效高质量搭建后台系统系列尾篇本篇主要介绍表单查询、表单验证、通知（WebSocket）、自动构建
评估链式过滤器时忽略过滤器分号的 FFmpeg 结尾
我是 FFmepg 的新手，所以如果术语有误，请原谅我。我想将文本和音频添加到现有的视频文件中。我链接在一起 2 drawText s，然后在不同的过滤器中，我想合并原始源视频的音轨和一些背景音乐。
ripgrep - 使用ripgrep搜索单词的开头/结尾
使用grep我可以使用以下命令搜索单词的开头和结尾 grep -e '\' 这将找到I have a leg.，但找不到play allegro here。 Ripgrep(0.10.0)似乎不支持
javascript - 为什么ajax调用url以#结尾？
$.ajax({ type:'GET', cache: 'false', url:"/foo/", data:{"id": pid}, success:func
iphone - UIGestureRecognizer 结尾
我想在我的 iPhone 应用程序中处理旋转手势并在此期间旋转 imageView。在手势结束时，我想将 imageView 旋转到固定位置。所以，即。如果我将 imageView 从 0 弧度旋转到
c# - 在运行时动态地将代码添加到方法的开头/结尾
我知道检测是一种将跟踪代码动态添加到方法中以启用跟踪和调试的技术。我想知道这是否只是一个“跟踪”选项，硬编码到 CLR 中以仅添加跟踪代码，或者是否能够向方法添加任何代码？例如，我想检查某个类中每
c - 为什么C文件会以/*[]*/结尾
我正在查看一些专有源代码:使用库的示例程序。代码是用 C 和 C++ 编写的，使用 make 构建系统。每个文件都以注释掉的 [] 结尾:/*[]*/ 源文件和 #[]#对于生成文件。这可能是什么
c# - 检测文件的每一行如何以 C# 结尾
是否可以循环文件中的每一行并检查它是如何结束的(LF/CRLF): using(StreamReader sr = new StreamReader("TestFile.txt")) { st
JSF 仅适用于 .xhtml 结尾
我从 JSF 网站的编程开始。目前所有文件都以 .xhtml 结尾。当我去http://localhost:8080/myProject/start.jsf一切正常。但是当我将文件从 start.xh
.htaccess - 如何强制某些页面以斜杠[.htaccess]结尾
这是一个多站点问题。我有很多网站都带有.htaccess文件，其中包含多行，类似于: rewriterule ^(page-one|page-two|page-three)/?$ /index.php
Vim - 如何跳转到段落的开头/结尾(适用于所有情况)
真的没有简单的映射来跳转到段落的第一行或最后一行吗？ { 和 } 是“独占”命令，因此它们会跳转到段落前后的空行如果有的话，但对于段落的实际第一行或最后一行(即，当段落位于缓冲区的顶部或底部时)。这
android - 改造 - 基本网址必须以/结尾
我已经尝试了该站点上所有可能的解决方案。我以前使用过改造，过去已经解决了这个问题，但这次我无法解决。我正在使用 StackOverflow API 来获取问题及其详细信息。 API : https:/
perl - PERL 中的模式匹配以句点 "."结尾
我正在做模式匹配如下。但我没有得到正确的输出。请建议正确的代码以获得正确的输出。代码 #! /usr/bin/perl -w my $subString = "1.3.6.1.2.1.26.2.1.
javascript - 检查整数是否以 0 结尾
如何创建 if 语句以检查整数是否以 0 结尾？例如，我想要一个这样的 if 语句: var test = 107; //107 is an example it'should some unkno
javascript - 检查数字是否以 00 结尾
这个问题已经有答案了: javascript how to tell if one number is a multiple of another (6 个回答) 已关闭 3 年前。每当秒 var
BASH 测试文件名是否以 .dylib 结尾
我正在遍历文件树以识别所有 .DYLIB 文件。 #!/bin/bash #script to recursively travel a dir of n levels function traver

首页

博学

6Ren·AI

商城

regex - 正则表达式匹配以特殊字符结尾的句子，如 . ! ？但忽略像 George W. Bush,Mr. 这样的话。 ETC