python - Lookahead 正则表达式无法找到相同的重叠匹配项-6ren

python - Lookahead 正则表达式无法找到相同的重叠匹配项

转载作者：行者123 更新时间：2023-11-30 21:50:42

24

4

再次搜索相同模式时是否可以使用正则表达式找到重叠匹配项？我希望能够找到出现三次的匹配项。例如，bababa 在 babababab 中出现了 3 次:

巴巴布巴巴布

babababab

爸爸爸爸

这是我当前的 Python 实现:

import re
matches = re.findall(r'(?=(\w+).*\1).*\1', "babababab")
print(matches)

我的程序只找到baba而不是babab。谢谢!

最佳答案

这里您可以使用的一个技巧是实际上只匹配 ba(?=bab)，这只会消耗 ba，从而允许正则表达式引擎逻辑上向前移动仅通过一场比赛:

matches = re.findall(r'ba(?=bab)', "babababab")
matches = [i + 'bab' for i in matches]
print(matches)

打印:

['babab', 'babab', 'babab']

请注意，我将尾部 bab 连接到每个匹配，这很好，因为我们知道实际的逻辑匹配是 babab。

关于python - Lookahead 正则表达式无法找到相同的重叠匹配项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60293891/

24

4

0

文章推荐： python - 确保 python 脚本不以 root 身份运行

文章推荐： php - jQuery Ui 自动完成不使用 PHP MySQL 检索结果

文章推荐： java - Hibernate - 选择表格中的所有行

regex - 非贪婪的 LookAhead
我有如下字符串: val:key 我可以使用 /^\w*/ 捕获“val”。我现在如何获取“key”而不“:”符号？谢谢最佳答案这个怎么样？ /^(\w+):(\w+)$/ 或者，如果您只想捕
python - Lookahead 正则表达式无法找到相同的重叠匹配项
再次搜索相同模式时是否可以使用正则表达式找到重叠匹配项？我希望能够找到出现三次的匹配项。例如，bababa 在 babababab 中出现了 3 次: 巴巴布巴巴布 babababab 爸爸爸爸这是
JavaScript 使用 Lookahead 匹配多行中的相似模式
我正在尝试提出正则表达式 block ，该 block 将使用 JavaScript 从 cucumber 样本中提取表。 cucumber 样本如下 Feature: Sample Feature
javascript - Lookahead (?=模式) 没有前面的模式
这个问题已经有答案了: Reference - What does this regex mean? (1 个回答) 已关闭 7 年前。我了解到lookahead正则表达式是这样的x(?=y)和意味
java - 如何修复解析错误(使用 LOOKAHEAD)
我的解析器生成器(使用 javaCC)有问题我有这个错误: Warning: Choice conflict involving two expansions at line 119, c
java - 正则表达式 Lookahead 未按预期匹配
我正在编写一个小型java程序来进行一些数据库清理，当它们与某些关键字出现在同一个句子中时，我需要从大文本 block 中提取日期，并且我遇到了一些奇怪的行为想不通。例如，以下正则表达式: "(?=.
c# - 使用 Lookahead 使用正则表达式匹配字符串
我需要使用正则表达式来匹配一个字符串 holiding html 以拉出所有嵌套的跨度，我假设我假设有一种方法可以使用正则表达式来执行此操作，但整个上午都没有成功。所以对于示例输入字符串
Javacc 解析器选项 LOOKAHEAD，Java
我最近开始研究使用 javacc 的语法分析器，其中一个字段是选项 one...我有如下代码: options { LOOKAHEAD=1; } PARSER_BEGIN(Calculator)
regex - 如何转换使用 Lookahead 的正则表达式模式？
我无法将此正则表达式转换为 Golang 支持的内容。我能得到一些帮助吗？它最初来自 this SO question . ^(?=.{1,24}$)(?![_.])(?!.*[_.]{2})[a-z
Java 正则表达式 : Negative lookahead
我正在尝试制作两个匹配 URI 的正则表达式。这些 URI 的格式为:/foo/someVariableData 和 /foo/someVariableData/bar/someOtherVariab
regex - 我们需要 Lookahead/Lookbehind 零宽度断言做什么？
我刚刚更详细地了解了这两个概念。我一直对 RegEx 很好，似乎我从未见过这 2 个零宽度断言的必要性。我很确定我错了，但我不明白为什么需要这些结构。考虑这个例子: Match a 'q' whic
javascript - 使用具有特殊条件的正则表达式(lookahead/lookbehind)字符串替换哈希
让我留下以下字符串列表，在 JavaScript (NodeJS) 中，我想一次应用一个正则表达式并替换 . 和 . 之间的哈希值，但我不想替换这个词，.style。或 .bundle. 或 .chu
java - 使用 Lookahead Regex 时出现模式异常
我有以下正则表达式来验证字符串中的条件，我在在线正则表达式 validator 上编写了它，但是当我在 Java 代码中使用它时出现异常: "(^([a-z]{1,6})(?(?=(_))(([_])
parsing - Ant : lookahead and lookbehind examples
我很难搞清楚如何识别某些文本，前提是它之前和之后都有特定的东西。任务是识别 AND、OR 和 NOT，但如果它们是单词的一部分则不是: 他们应该在这里被识别: x AND y (x)AND(y) NO
java - 正则表达式: How to Combin Lookahead and Lookbehind
我有一串以逗号分隔的字符，需要拆分。不过，其中一些字符可能是逗号。例如: test = "a,b,c,d,,,e,f,g" 我知道(?
java - 无法使 Negative Lookahead 正则表达式正确匹配
我正在尝试匹配 Java 中没有 .jsp/.jspx 扩展名的字符串，并且在负向先行模式方面遇到了很多困难。给定一堆字符串: String string1 = "templateName"; St
java - javacc 中多余的 LOOKAHEAD 会导致错误吗？
我有以下TT.jj，如果我取消注释下面的SomethingElse部分，它会成功解析create create blahblah形式的语言> 或创建废话。但是，如果我注释掉下面的 SomethingE
Java 正则表达式 Lookbehind 和 Lookahead
我想创建一个可以识别字符串中的等号的正则表达式。唯一的条件是等号前面不能有以下字符:“”、“~”和“=”。它后面也不能跟这个字符“=”。我使用的正则表达式语句是这样的:(?~=])=(?=[^=])并
正则表达式 : lookbehind and lookahead and greediness problem
这应该很简单，但我是菜鸟，我一辈子也搞不懂。我正在尝试使用正则表达式来匹配特殊打开/关闭标签内的文本:[p2][/p2] 所以在这段文字中: apple [p2]banana[/p2] grape [
python - 在Keras中执行最新的 "Lookahead Optimizer"论文？
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 3 年前。 Improve this qu

首页

博学

6Ren·AI

商城

python - Lookahead 正则表达式无法找到相同的重叠匹配项