gpt4 book ai didi

python - 如何格式化正则表达式

转载 作者:太空宇宙 更新时间:2023-11-03 17:19:53 24 4
gpt4 key购买 nike

我正在尝试创建一个警告动摇器,它可以在日志文件中查找已知的警告。

在检查警告期间,挥动文件中的警告是直接从日志文件复制的。

这里的任务是让它尽可能简单。但我发现直接复制有点问题,因为警告可能包含绝对路径。

所以我添加了一个“标签”,可以将其插入到系统应该查找的警告中。整个字符串将如下所示。

WARNING:HDLParsers:817 - ":RE[.*]:/modules/top/hdl_src/top.vhd" Line :RE[.*]: Choice . is not a locally static expression.

标签为:RE[在此处插入正则表达式]:。在上面的警告字符串中,有两个标签,我试图使用 Python3 正则表达式工具找到它们。我的模式如下:

(:RE\[.*\]\:)

参见RegEx101供引用

我的问题是,当我的字符串中有两个标签时,它只找到一个从第一个标签延伸到最后一个标签的结果。我如何设置正则表达式才能找到每个标签?

问候

最佳答案

您可以将 re.findall 与以下正则表达式一起使用,假设方括号内的正则表达式从 :RE[ 一直到 ] 后跟 ]:

:RE\[.*?]:

参见regex demo.*? 匹配除换行符之外的 0 个或多个字符,但尽可能少。请参阅rexegg.com description of a lazy quantifier solution :

The lazy .*? guarantees that the quantified dot only matches as many characters as needed for the rest of the pattern to succeed.

参见IDEONE demo

import re
p = re.compile(r':RE\[.*?]:')
test_str = "# Even more commments\nWARNING:HDLParsers:817 - \":RE[.*]:/modules/top/hdl_src/cpu_0342.vhd\" Line :RE[.*]: Choice . is not a locally static expression."
print(p.findall(test_str))

如果您需要获取 [] 之间的内容,请使用捕获组,以便 re.findall 可以仅提取这些内容内容:

p = re.compile(r':RE\[(.*?)]:')

参见another demo

要获取索引,请使用 re.finditer (参见this demo):

re.finditer(pattern, string, flags=0)
Return an iterator yielding match objects over all non-overlapping matches for the RE pattern in string. The string is scanned left-to-right, and matches are returned in the order found. Empty matches are included in the result unless they touch the beginning of another match.

p = re.compile(r':RE\[(.*?)]:')
print([x.start(1) for x in p.finditer(test_str)])

关于python - 如何格式化正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33282095/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com