- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我写了 2 个 RE 来匹配一个 String 中的几个字符串序列。例如假设这两个正则表达式是 RE1
、RE2
。字符串可以是这4种形式;
1) Match ONLY RE1 'one or more times'2) Match ONLY RE2 'one or more times'3) Match RE1 'one or more times' AND match RE2 'one or more times'4) Match NEITHER RE1 NOR RE2
目前我正在使用 if
来检查其中的每一个,但我知道它非常昂贵,因为我多次对特定字符串进行匹配。我想过使用 'or' |
但问题是正则表达式一旦找到第一个匹配序列就会停止匹配并且不会继续寻找其他序列。我想“一次或多次”找到匹配序列。
更新:
eg: RE1 = (\d{1,3}[a-zA-Z]?/\d{1,3}[a-zA-Z]?) RE2 = (\babc\b)String: *some string* 100/64h *some string* 120h/90 *some string* abc 200/100 abc *some string* 100h/100fMatches: '100/64h', '120h/90', 'abc', '200/100', 'abc', '100h/100f'
如何合并这 2 个 RE 以使我的程序高效。我正在使用 python 对此进行编码。
最佳答案
你说“我知道它非常昂贵,因为我多次对特定字符串进行匹配。”这对我来说意味着您要多次运行每个 RE。在这种情况下,您犯了一个错误,无需编写更复杂的 RE 即可解决。
re1_matches = re.findall(re1, text)
re2_matches = re.findall(re2, text)
这将产生两个匹配列表。然后,您可以对这些列表执行 bool 运算以生成您需要的任何结果;或者,如果您需要一个列表中的所有匹配项,则可以将它们连接起来。如果您不需要,您还可以对其中的每一个使用 re.match
(匹配锚定在字符串的开头)或 re.search
(匹配字符串中的任何位置)结果列表,但只需要知道有匹配即可。
无论如何,在这种情况下创建更复杂的 RE 可能没有必要或不可取。
但我并不能立即清楚你到底想要什么,所以我可能是错的。
关于如何使用 bool 运算符处理列表的一些建议。首先进行一些设置:
>>> re1 = r'(\d{1,3}[a-zA-Z]?/\d{1,3}[a-zA-Z]?)'
>>> re2 = r'(\babc\b)'
>>> re.findall(re1, text)
['100/64h', '120h/90', '200/100', '100h/100f']
>>> re.findall(re2, text)
['abc', 'abc']
>>> re1_matches = re.findall(re1, text)
>>> re2_matches = re.findall(re2, text)
>>> rex_nomatch = re.findall('conglomeration_of_sandwiches', text)
and
返回第一个 False 结果,如果所有结果都为 True,则返回最终结果。
>>> not re1_matches and re2_matches
False
所以如果你想要列表而不是一个简单的 bool 值,你必须最后测试你想要的结果:
>>> not rex_nomatch and re1_matches
['100/64h', '120h/90', '200/100', '100h/100f']
类似地:
>>> not rex_nomatch and re2_matches
['abc', 'abc']
如果您只想知道两个 RE 都生成了匹配项,但不再需要,您可以这样做:
>>> re1_matches and re2_matches
['abc', 'abc']
最后,如果两个 RE 都生成匹配项,这里有一种获取连接的紧凑方法:
>>> re1_matches and re2_matches and re1_matches + re2_matches
['100/64h', '120h/90', '200/100', '100h/100f', 'abc', 'abc']
关于python - 将多个正则表达式合并为一个 RE,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6613831/
我正在用 yacc/bison 编写一个简单的计算器。 表达式的语法看起来有点像这样: expr : NUM | expr '+' expr { $$ = $1 + $3; } | expr '-'
我开始学习 lambda 表达式,并在以下情况下遇到了以下语句: interface MyNumber { double getValue(); } MyNumber number; nu
这两个 Linq 查询有什么区别: var result = ResultLists().Where( c=> c.code == "abc").FirstOrDefault(); // vs. va
如果我们查看 draft C++ standard 5.1.2 Lambda 表达式 段 2 说(强调我的 future ): The evaluation of a lambda-expressio
我使用的是 Mule 4.2.2 运行时、studio 7.5.1 和 Oracle JDK 1.8.0_251。 我在 java 代码中使用 Lambda 表达式,该表达式由 java Invoke
我是 XPath 的新手。我有网页的html源 http://london.craigslist.co.uk/com/1233708939.html 现在我想从上面的页面中提取以下数据 完整日期 电子
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我将如何编写一个 Cron 表达式以在每天上午 8 点和下午 3:30 触发?我了解如何创建每天触发一次的表达式,而不是在多个设定时间触发。提前致谢 最佳答案 你应该只使用两行。 0 8 * * *
这个问题已经有答案了: What do 3 dots next to a parameter type mean in Java? (9 个回答) varargs and the '...' argu
我是 python 新手,在阅读 BeautifulSoup 教程时,我不明白这个表达式“[x for x in titles if x.findChildren()][:-1]”我不明白?你能解释一
(?:) 这是一个有效的 ruby 正则表达式,谁能告诉我它是什么意思? 谢谢 最佳答案 正如其他人所说,它被用作正则表达式的非捕获语法,但是,它也是正则表达式之外的有效 ruby 语法。 在
这个问题在这里已经有了答案: Why does ++[[]][+[]]+[+[]] return the string "10"? (10 个答案) 关闭 8 年前。 谁能帮我处理这个 JavaSc
这个问题在这里已经有了答案: What is the "-->" operator in C++? (29 个答案) Java: Prefix/postfix of increment/decrem
这个问题在这里已经有了答案: List comprehension vs. lambda + filter (16 个答案) 关闭 10 个月前。 我不确定我是否需要 lambda 或其他东西。但是,
C 中的 assert() 函数工作原理对我来说就像一片黑暗的森林。根据这里的答案https://stackoverflow.com/a/1571360 ,您可以使用以下构造将自定义消息输出到您的断言
在this页,John Barnes 写道: If the conditional expression is the argument of a type conversion then effec
我必须创建一个调度程序,它必须每周从第一天上午 9 点到第二天晚上 11 点 59 分运行 2 天(星期四和星期五)。为此,我需要提供一个 cron 表达式。 0-0 0-0 9-23 ? * THU
我正在尝试编写一个 Linq 表达式来检查派生类中的属性,但该列表由来自基类的成员组成。下面的示例代码。以“var list”开头的 Process 方法的第二行无法编译,但我不确定应该使用什么语法来
此 sed 表达式将输入字符串转换为两行输出字符串。两条输出行中的每一行都由输入的子串组成。第一行需要转换成大写: s:random_stuff\(choice1\|choice2\){\([^}]*
我正在使用 Quartz.Net 在我的应用程序中安排我的工作。我只是想知道是否可以为以下场景构建 CRON 表达式: Every second between 2:15AM and 5:20AM 最
我是一名优秀的程序员,十分优秀!