Python - 错误 : look-behind requires fixed-width pattern-6ren

Python - 错误 : look-behind requires fixed-width pattern

转载作者：行者123 更新时间：2023-12-04 20:41:40

28

4

我有一个看起来像的字符串:

phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'

我想返回一个删除了某些单词的新字符串，前提是它们前面没有某些其他单词。

例如，我要删除的词是:

c_out = ["avon", "powys", "somerset","hampshire"]

只有当他们不遵循:

c_except = ["on\s","dinas\s"]

注意: c_out 中可能有多个单词实例，以及 c_except 中的多个单词实例.

我个人尝试过 'on\s' :

phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'

regexp1 = re.compile(r'(?<!on\s)(avon|powys|somerset|hampshire)')
print("1st Result: ", regexp1.sub('', phrase))
1st Result:  '5  road bradford on avon avon dinas   north'

这正确地忽略了第一个 'avon' ，因为它前面是 'on\s' ，它正确地删除了第三个 'avon' , 但是它忽略第二个 'avon' (它不会删除)。

同理，对于 'dinas\s' :

phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'

regexp2 = re.compile(r'(?<!dinas\s)(avon|powys|somerset|hampshire)')
print("2nd Result: ", regexp2.sub('', phrase))
2nd Result:  '5  road bradford on   dinas powys  north '

这正确地忽略了第一个 'powys'并删除第二个(注意 '... powys north' 之间的双空格。

我尝试通过执行以下操作来组合这两个表达式:

regexp3 = re.compile(r'((?!on\s)|(?!dinas\s))(avon|powys|somerset|hampshire)')
print("3rd Result: ", regexp3.sub('', phrase))
3rd Result:  5  road bradford on   dinas   north

这错误地删除了每个单词，并完全忽略了 'on\s'或 'dinas\s' .

然后我尝试:

regexp4 = re.compile(r'(?<!on\s|dinas\s)(avon|powys|somerset|hampshire)')
print("4th Result: ", regexp4.sub('', phrase))

并得到:

error: look-behind requires fixed-width pattern

我想结束:

Result: '5  road bradford on avon dinas powys  north     '

我看过:

Why is this not a fixed width pattern?
Python Regex Engine - "look-behind requires fixed-width pattern" Error
regex: string with optional parts

但无济于事。

我究竟做错了什么？

来自评论:

regexp5 = re.compile(r'(?<!on\s)(?<!dinas\s)(avon|powys|somerset|hampshire)')
print("5th Result: ", regexp5.sub('', phrase))
5th Result:  5  road bradford on avon avon dinas powys  north

这再次错过了第二个雅芳。

最佳答案

这里有两种方法可以解决这个问题:
链式后视
将基于交替的lookbehind 转换为几个negative lookbehind，因为它们之间的逻辑关系将相同(AND 的逻辑关系):

import re
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
c_except = [r"on\s",r"dinas\s"]
c_out = ["avon", "powys", "somerset","hampshire"]
rx = r"(?<!\b{0})({1})".format(r")(?<!\b".join(c_except), "|".join(c_out))
print(re.sub(rx, "", phrase))

见 this Python demo .
捕获方法
捕获您需要保留的内容并仅匹配您需要删除的内容，然后使用 \1恢复组 1 值的反向引用:

import re
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
c_except = [r"on\s+",r"dinas\s+"]
c_out = ["avon", "powys", "somerset","hampshire"]
rx = r"(\b(?:{0})(?:{1}))|(?:{1})".format(r"|".join(c_except), "|".join(c_out))
print(re.sub(rx, r"\1", phrase))

见 another Python demo .
请注意，这种方法是有利的，因为您可以在 c_except 中使用可变宽度图案。 .
正则表达式看起来像

(\b(?:on\s+|dinas\s+)(?:avon|powys|somerset|hampshire))|(?:avon|powys|somerset|hampshire)

它将匹配 on或 dinas由于 \b整个词词边界，然后是您需要删除的任何术语，并且由于该部分包含在捕获组中，因此您可以使用 \1 来引用捕获。反向引用。在所有其他上下文中， c_out条款将被删除 |(?:avon|powys|somerset|hampshire)图案。
注意: \1替换将在 Python 3.5+ 中工作。对于旧版本和 Python 2.x，您需要将其替换为 lambda:

re.sub(rx, lambda m: m.group(1) if m.group(1) else "", phrase)

关于Python - 错误 : look-behind requires fixed-width pattern，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45479563/

28

4

0

文章推荐： sql - 排除非排他性出现的值对

文章推荐： vim - 禁用 Vim 命令行反馈消息

文章推荐： php - 如何在另一个请求之前存储 PHP 变量

regex - 是否有其他正则表达式语法可避免出现 “look-around, including look-ahead and look-behind, is not supported”错误？
我尝试实现此正则表达式来检查字符串("username")的长度是否在3到30之间，是否仅包含字母(a-z)，数字(0-9)和句点(.)(不连续): use regex::Regex; // 1.3.
javascript - 正则表达式 : Using a negative look ahead for the nonsupported negative look behind and capturing the look behind characters upon split
我又在与正则表达式作斗争了。我一直在尝试添加使用转义字符来转义自定义标记，例如至和至 .在乔治的帮助下，here , 在尝试转义方法之前，以下表达式会产生所需的结果。 ('This is a
python - 使用 Look Behind 或 Look Ahead 函数查找匹配项时的正则表达式模式
我试图根据Python中的正常语法规则正确地分割句子。我要拆分的句子是 s = """Mr. Smith bought cheapsite.com for 1.5 million dollars,
Java 正则表达式 : Remove (double) negative look ahead and look behind
我有以下将字符串与模式匹配的正则表达式: (?i)(?
C# 正则表达式 : Combine a look ahead regex and a look behind regex into one
我想使用正则表达式过滤掉不使用“\r\n”作为换行符的文件。例如，如果文件包含单个“\n”或单个“\r”，则将被过滤为不合格文件。我已经找到了: new Regex(@"(?
regex - 语法错误 : (irb):4: invalid pattern in look-behind (positive look-behind/ahead)
我正在尝试编写一个正则表达式替换模式，以便替换散列中的数字，如下所示: regexr link some_dict = { TEST: 123 } 这样就可以捕获和替换 123 个。(? " T
curl - 如何在Logstash中将事件标记为 “Looked At”
因此，我正在使用此查询查询Logstash，该查询返回堆栈顶部的所有内容: { "query": { "match_all": { } }, "size": 7, "_source": { "incl
JavaScript棋盘游戏: looking for optimization
我正在为 Android 开发 html/javascript 游戏。这是一款棋盘游戏，具有以下功能。它具有不同颜色的图 block ，用户可以在板上放置一个图 block (以编程方式选择)。如果我
c++ - "Looking At"具有四元数的对象
所以我目前正在尝试创建一个函数，它将采用两个 3D 点 A 和 B，并为我提供代表 A 点“观察”B 点所需的旋转的四元数(这样点 A 的局部 Z轴穿过点 B，如果你愿意的话)。我最初找到了this
Look And Say 序列php实现代码
比如：第一个数字是：1。看着第一个数字你可以说1个1，那么第二个数字就是：11。看着第二个数字你可以说2个1，即第三个数字是：21。看着第三个
html - 为什么当缩放改变时具有相同高度 "look"的元素不同？
基本上，要点在主题中。当我创建两个具有固定高度 (2px) 的相同 div，并将缩放比例更改为 75% 或 125% 时，由于某种原因它们“看起来”不同，有人可以解释一下这里发生了什么吗？我该如何解
android - Chrome远程调试android : looks broken
我正在使用 chrome://inspect/#devices通过cordova检查我的android-app构建的WebView。它在我的 Mac 上运行模拟器。可以找到该设备，但如果我在 WebV
Angularjs:如何制作服务代码 "look synchronous"？
如何使 Angular 服务代码“看起来同步”？当我清理 Controller 并将业务逻辑代码放入服务中时，我的问题出现了。到目前为止，一切都很好。现在我想在服务函数中“等待”，直到所有异步调用都
delphi - 从Delphi控件中删除 "3D look"
标准的 Delphi 控件(面板、按钮等)都有这种斜角效果(顶部和左侧的白线)，这给它们带来了 3D 感觉，但今天这让它们看起来很老式。有没有办法至少在 Delphi 7 中删除这种“3D 外观”？
java - JFileChooser > "Look in"奇怪的名字
我有一个在 Win7 上使用 JFileChooser 的 java 应用程序。奇怪的是，有时(经常)但并非总是如此 - 驱动器名称在“查找范围:”组合框中看起来很奇怪: 有没有人知道是什么原因造成的
Clojure "look-and say"序列
正在处理一些2015 AoC学习 clojure 的问题...下面的代码对于第 40 次迭代来说足够快，但在那之后很长时间就陷入了停滞。我与其他一些人的解决方案进行了比较，但我并不清楚为什么这么慢。我
java - JFileChooser > "Look in"奇怪的名字
我有一个在 Win7 上使用 JFileChooser 的 java 应用程序。奇怪的是，有时(经常)但并非总是如此 - 驱动器名称在“查找范围:”组合框中看起来很奇怪: 有没有人知道是什么原因造成的
Java JUnit : looking for a "assertNothing"
我从 JUnit 开始，尝试找到测试的最佳断言方法。假设我有一个函数来测试它不返回值如果输入无效则抛出异常例如 void foo (int a) throws Exception { if
c++ - 自制礼帽 : looks the same but not identical
为了我的优化，我想在 Rcpp 中获得一个像样的 toupper。我对 C++ 很陌生，据我所知，我已经做到了: #include using namespace Rcpp; void C_toup
java-3d - 如何在Java3d中实现Mouse Look
我在这里不知所措。我有一个简单的地形生成算法在工作，并且通过扩展 ViewPlatformAWTBehavior 和处理我自己的事件，我有一些简单的键盘导航在工作。一切都很好，我可以跟随地形。万岁!

首页

博学

6Ren·AI

商城

Python - 错误 : look-behind requires fixed-width pattern