gpt4 book ai didi

python - 如何在正则表达式中查看后面而不匹配模式本身?

转载 作者:行者123 更新时间:2023-11-30 22:27:54 26 4
gpt4 key购买 nike

假设我们想要提取标签中的链接,如下所示:

输入:

<p><a href="http://www.google.com/home/etc"><b>some text</b></a></p>

期望的输出:

http://www.google.com/home/etc

第一个解决方案是使用此 href=[\'"]?([^\'">]+) 正则表达式查找引用匹配 但我想要实现的是匹配href后面的链接。所以尝试这个 (?=href\")... (前瞻断言:匹配而不消耗)仍然匹配 href 本身。

这只是一个正则表达式的问题。

最佳答案

许多基于正则表达式的解决方案之一是捕获组:

>>> re.search(r'href="([^"]*)"', s).group(1)
'http://www.google.com/home/etc'

[^"]* 匹配任何非“的数字。

关于python - 如何在正则表达式中查看后面而不匹配模式本身?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46753989/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com