Python 正则表达式 : Capture overlapping parts-6ren

Python 正则表达式 : Capture overlapping parts

转载作者：行者123 更新时间：2023-12-02 06:03:27

25

4

给定一个字符串 s = "<foo>abcaaa<bar>a<foo>cbacba<foo>c"我正在尝试编写一个正则表达式，它将提取以下部分:尖括号及其内部文本和周围文本。像这样:

<foo>abcaaa
abcaaa<bar>a
a<foo>cbacba
cbacba<foo>c

所以预期的输出应该是这样的:

["<foo>abcaaa", "abcaaa<bar>a", "a<foo>cbacba", "cbacba<foo>c"]

我发现了这个问题How to find overlapping matches with a regexp?这让我更接近期望的结果，但我的正则表达式仍然不起作用。

regex = r"(?=([a-c]*)\<(\w+)\>([a-c]*))"

有什么想法可以解决这个问题吗？

最佳答案

您可以通过在环视断言中使用捕获组来将重叠内容与标准正则表达式语法进行匹配，因为这些组可能会匹配字符串的部分内容，而不会消耗匹配的子字符串，从而阻止其进一步匹配。在这个特定的示例中，我们匹配字符串的开头或 > 作为捕获实际目标的前瞻断言的 anchor :

(?:\A|>)(?=([a-c]*<\w+>[a-c]*))

参见regex demo .

在 python 中，我们使用 re.findall() 的属性，仅在表达式中存在捕获组时返回在组中捕获的匹配项:

text = '<foo>abcaaa<bar>a<foo>cbacba<foo>c'
expr = r'(?:\A|>)(?=([a-c]*<\w+>[a-c]*))'
captures = re.findall(expr, text)
print(captures)

输出:

['<foo>abcaaa', 'abcaaa<bar>a', 'a<foo>cbacba', 'cbacba<foo>c']

关于Python 正则表达式 : Capture overlapping parts，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60981242/

25

4

0

文章推荐： r - 将气泡颜色指定为变量限制了 ggplot 中的选择

文章推荐： Java认证: How to override methods that define a throws exception?

文章推荐： java - 使用数组在 system.print 上格式化为小数点后三位

capture - 像 Slurpy 一样使用 Capture
我一直在阅读 Captures这一段引起了我的兴趣: Inside a Signature, a Capture may be created by prefixing a sigilless par
Java 正则表达式 : Why is the non-capturing group captured?
我在 Java 中使用这个正则表达式: ^(Mon(?:.?|day)?)(?:[\.,])?$ (可以测试 here ) 我想捕获日期，后跟可选的 . 或 ,。如果是星期一，我想捕获 Monday
C# Windows 窗体 : How to capture Capture Function, 箭头和导航键
我正在 try catch 功能键 F1 到 F12 和 4 个箭头键以及主页、插入、删除、结束、向上翻页和向下翻页键。如何？？？？ private void Form1_KeyPress(objec
html - 输入类型文件标签中的 capture ="user"和 capture ="camera"有什么区别？
没有capture="camera" input type="file" 的属性标签 in official w3.org documentation . 讽刺的是，我发现了这么多地方 capture
memory - 为什么在Rust中 “capture by reference”与 “capture a reference by value”等效？
摘自Huon Wilson的Finding Closure in Rust: Capturing entirely by value is also strictly more general tha
java generics - Comparable 类型中的方法compareTo(capture#1-of ?) 不适用于参数
所以我想这样做: public interface IFieldObject { public Comparable get(); } public interface IFieldCondi
Python 正则表达式 : Capture lookahead value (capturing text without consuming it)
我希望使用正则表达式将单词分成组(vowels, not_vowels, more_vowels)，使用标记来确保每个单词以元音开头和结尾。 import re MARKER = "~" VOWELS
php - How to Capture Szimek/Signature_Pad with PHP (Capture Javascript into PHP Variable)?
我在浏览 StackOverflow 时发现了 Szimek/Signature_Pad 以使用 Javascript 捕获电子/数字签名。我研究过，但我仍然对如何将 DATA URI 捕获到变量中
c++ - 错误 : variable "cannot be implicitly captured because no default capture mode has been specified"
我正在尝试关注 this example使用带有 remove_if 的 lambda。这是我的尝试: int flagId = _ChildToRemove->getId(); auto new_e
angular - ngx-捕获 : Unable to capture inside the screen capture area
我无法捕获在屏幕捕获区域内。我想要一个定义的部分，其中包含要捕获的图像和内容。我们怎样才能做到这一点？帮助! 访问:https://stackblitz.com/edit/ngx-capture-
perl - Perl 的 Capture::Tiny::capture() 是否避免了使用 system() 时需要的磁盘 io？
从 Perl 脚本调用外部程序时，Capture::Tiny 是否避免了使用 system() 时需要的磁盘 io？使用任何一种时，我都能获得基本相同的性能。一位同事正在使用我的代码并告诉我它正在敲打
c++ - 错误 C3493 : residual' cannot be implicitly captured because no default capture mode has been specified
作为数值方法研究的一部分，我正在编写一个函数来解决流值问题。这是该程序的“核心”，但它出现了一些奇怪的错误，这很奇怪，因为我在其他程序中使用了相同的代码段而没有出现任何错误。 void solve_
c++ - 在 lambda 表达式中，通过 [&captured] 和 [&local = captured] 捕获有什么区别？
vector vec; //a auto foo = [&vec](){ //do something }; //b auto foo = [&v = vec](){ //do som
python - PyDev 单元测试 : How to capture text logged to a logging. 记录器在 "Captured Output"
我正在使用 PyDev 对我的 Python 应用程序进行开发和单元测试。至于单元测试，除了没有内容被记录到日志框架之外，一切都很好。 PyDev 的“捕获的输出”没有捕获记录器。我已经将记录的所有
c++ - 编译器错误 C3493 : 'func' cannot be implicitly captured because no default capture mode has been specified
你能帮我解决这个编译器错误吗？ template static void ComputeGenericDropCount(function func) { T::ForEach([](T *w
java - GenericDao 类型中的方法 read(capture#2-of ?) 不适用于参数 (Long)
第一次做泛型，我有点困惑。我有以下内容: public interface GenericDao { /** * Retrieve an object that was previ
C++ Visual Studio 错误 : Identifier cannot be implicitly captured because no default capture mode has been specified
我正在尝试提取此代码中 dir_entry.path() 的值并想将其复制到 compFileName 中。问题是我一直收到错误“compFileName cannot be implicitly c
C# 网络摄像头 WM_CAP_CONNECT : Want to force a capture source when multiple capture sources present
我正在使用在网上找到的 WebCam_Capture 代码通过 C# 访问网络摄像头。在一台只有一个视频源的计算机上，它就像一个魅力! (程序在启动时启动，找到网络摄像头并正常工作)。虽然在一台有很
c++ - Lambda 捕获列表 : capturing object's member field by value not possible without capturing the whole object?
下面的代码 void CMainWindow::someMethod(const CLocationsCollection& parentItem) { auto f = [this, par
video-capture - 如何获取当前在浏览器中播放的电影的视频文件？
所以我打开了一个 youtube 页面，我可以在那里观看视频。但是这个视频被用户下架了。我打开的页面仍然有视频，如果你再次访问(刷新)新页面没有。由于我在浏览器选项卡 (chrome) 中加载了视

首页

博学

6Ren·AI

商城

Python 正则表达式 : Capture overlapping parts