- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个看起来像的字符串:
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
c_out = ["avon", "powys", "somerset","hampshire"]
c_except = ["on\s","dinas\s"]
c_out
中可能有多个单词实例,以及
c_except
中的多个单词实例.
'on\s'
:
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
regexp1 = re.compile(r'(?<!on\s)(avon|powys|somerset|hampshire)')
print("1st Result: ", regexp1.sub('', phrase))
1st Result: '5 road bradford on avon avon dinas north'
'avon'
,因为它前面是
'on\s'
,它正确地删除了第三个
'avon'
,
但是 它忽略第二个
'avon'
(它不会删除)。
'dinas\s'
:
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
regexp2 = re.compile(r'(?<!dinas\s)(avon|powys|somerset|hampshire)')
print("2nd Result: ", regexp2.sub('', phrase))
2nd Result: '5 road bradford on dinas powys north '
'powys'
并删除第二个(注意
'... powys north'
之间的双空格。
regexp3 = re.compile(r'((?!on\s)|(?!dinas\s))(avon|powys|somerset|hampshire)')
print("3rd Result: ", regexp3.sub('', phrase))
3rd Result: 5 road bradford on dinas north
'on\s'
或
'dinas\s'
.
regexp4 = re.compile(r'(?<!on\s|dinas\s)(avon|powys|somerset|hampshire)')
print("4th Result: ", regexp4.sub('', phrase))
error: look-behind requires fixed-width pattern
Result: '5 road bradford on avon dinas powys north '
regexp5 = re.compile(r'(?<!on\s)(?<!dinas\s)(avon|powys|somerset|hampshire)')
print("5th Result: ", regexp5.sub('', phrase))
5th Result: 5 road bradford on avon avon dinas powys north
最佳答案
这里有两种方法可以解决这个问题:
链式后视
将基于交替的lookbehind 转换为几个negative lookbehind,因为它们之间的逻辑关系将相同(AND 的逻辑关系):
import re
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
c_except = [r"on\s",r"dinas\s"]
c_out = ["avon", "powys", "somerset","hampshire"]
rx = r"(?<!\b{0})({1})".format(r")(?<!\b".join(c_except), "|".join(c_out))
print(re.sub(rx, "", phrase))
见
this Python demo .
\1
恢复组 1 值的反向引用:
import re
phrase = '5 hampshire road bradford on avon avon dinas powys powys north somerset hampshire avon'
c_except = [r"on\s+",r"dinas\s+"]
c_out = ["avon", "powys", "somerset","hampshire"]
rx = r"(\b(?:{0})(?:{1}))|(?:{1})".format(r"|".join(c_except), "|".join(c_out))
print(re.sub(rx, r"\1", phrase))
见
another Python demo .
c_except
中使用可变宽度图案。 .
(\b(?:on\s+|dinas\s+)(?:avon|powys|somerset|hampshire))|(?:avon|powys|somerset|hampshire)
它将匹配
on
或
dinas
由于
\b
整个词词边界,然后是您需要删除的任何术语,并且由于该部分包含在捕获组中,因此您可以使用
\1
来引用捕获。反向引用。在所有其他上下文中,
c_out
条款将被删除
|(?:avon|powys|somerset|hampshire)
图案。
\1
替换将在 Python 3.5+ 中工作。对于旧版本和 Python 2.x,您需要将其替换为 lambda:
re.sub(rx, lambda m: m.group(1) if m.group(1) else "", phrase)
关于Python - 错误 : look-behind requires fixed-width pattern,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45479563/
我尝试实现此正则表达式来检查字符串("username")的长度是否在3到30之间,是否仅包含字母(a-z),数字(0-9)和句点(.)(不连续): use regex::Regex; // 1.3.
我又在与正则表达式作斗争了。我一直在尝试添加使用转义字符来转义自定义标记,例如 至 和 至 .在乔治的帮助下,here , 在尝试转义方法之前,以下表达式会产生所需的结果。 ('This is a
我试图根据Python中的正常语法规则正确地分割句子。 我要拆分的句子是 s = """Mr. Smith bought cheapsite.com for 1.5 million dollars,
我有以下将字符串与模式匹配的正则表达式: (?i)(?
我想使用正则表达式过滤掉不使用“\r\n”作为换行符的文件。例如,如果文件包含单个“\n”或单个“\r”,则将被过滤为不合格文件。 我已经找到了: new Regex(@"(?
我正在尝试编写一个正则表达式替换模式,以便替换散列中的数字,如下所示: regexr link some_dict = { TEST: 123 } 这样就可以捕获和替换 123 个。(? " T
因此,我正在使用此查询查询Logstash,该查询返回堆栈顶部的所有内容: { "query": { "match_all": { } }, "size": 7, "_source": { "incl
我正在为 Android 开发 html/javascript 游戏。这是一款棋盘游戏,具有以下功能。它具有不同颜色的图 block ,用户可以在板上放置一个图 block (以编程方式选择)。如果我
所以我目前正在尝试创建一个函数,它将采用两个 3D 点 A 和 B,并为我提供代表 A 点“观察”B 点所需的旋转的四元数(这样点 A 的局部 Z轴穿过点 B,如果你愿意的话)。 我最初找到了this
比如: 第一个数字是:1。 看着第一个数字你可以说1个1,那么第二个数字就是:11。 看着第二个数字你可以说2个1,即第三个数字是:21。 看着第三个
基本上,要点在主题中。 当我创建两个具有固定高度 (2px) 的相同 div,并将缩放比例更改为 75% 或 125% 时,由于某种原因它们“看起来”不同,有人可以解释一下这里发生了什么吗?我该如何解
我正在使用 chrome://inspect/#devices通过cordova检查我的android-app构建的WebView。它在我的 Mac 上运行模拟器。可以找到该设备,但如果我在 WebV
如何使 Angular 服务代码“看起来同步”? 当我清理 Controller 并将业务逻辑代码放入服务中时,我的问题出现了。到目前为止,一切都很好。现在我想在服务函数中“等待”,直到所有异步调用都
标准的 Delphi 控件(面板、按钮等)都有这种斜角效果(顶部和左侧的白线),这给它们带来了 3D 感觉,但今天这让它们看起来很老式。 有没有办法至少在 Delphi 7 中删除这种“3D 外观”?
我有一个在 Win7 上使用 JFileChooser 的 java 应用程序。奇怪的是,有时(经常)但并非总是如此 - 驱动器名称在“查找范围:”组合框中看起来很奇怪: 有没有人知道是什么原因造成的
正在处理一些2015 AoC学习 clojure 的问题...下面的代码对于第 40 次迭代来说足够快,但在那之后很长时间就陷入了停滞。我与其他一些人的解决方案进行了比较,但我并不清楚为什么这么慢。我
我有一个在 Win7 上使用 JFileChooser 的 java 应用程序。奇怪的是,有时(经常)但并非总是如此 - 驱动器名称在“查找范围:”组合框中看起来很奇怪: 有没有人知道是什么原因造成的
我从 JUnit 开始,尝试找到测试的最佳断言方法。 假设我有一个函数来测试它 不返回值 如果输入无效则抛出异常 例如 void foo (int a) throws Exception { if
为了我的优化,我想在 Rcpp 中获得一个像样的 toupper。我对 C++ 很陌生,据我所知,我已经做到了: #include using namespace Rcpp; void C_toup
我在这里不知所措。我有一个简单的地形生成算法在工作,并且通过扩展 ViewPlatformAWTBehavior 和处理我自己的事件,我有一些简单的键盘导航在工作。一切都很好,我可以跟随地形。万岁!
我是一名优秀的程序员,十分优秀!