gpt4 book ai didi

python 2.7 re.MULTILINE 问题

转载 作者:行者123 更新时间:2023-11-28 16:49:16 25 4
gpt4 key购买 nike

我是 python 的新手,我一直在尝试将我的 php 正则表达式更改为 python,但我遇到了这个多行问题。在过去的几天里,我一直在上网,但我似乎无法理解它,如果有人能提供帮助那就太好了。这是我制作的正则表达式:

mlsTagRegex = re.compile("<td\swidth=\"13%\"\sclass=\"TopHeader\">(.*?)</td>", re.MULTILINE)
tdTags = mlsTagRegex.findall(output.getvalue())
print tdTags

这是我希望它找到的 HTML:

<td width="13%" class="TopHeader">

<span class="red">I WANT THIS PART</span>

</td>

它只是给了我一个空数组。我很确定我所缺少的可能相当简单但是就像我说的我是 python 的新手所以如果有人可以帮忙吗?谢谢!

p.s.: findall 中的输出是 pycurl 输出的内容,html 的那部分在那里。

最佳答案

您需要使用 re.DOTALL使 . 匹配换行符:

mlsTagRegex = re.compile(r'<td width="13%" class="TopHeader">(.*?)</td>', re.DOTALL)

但实际上你应该避免使用正则表达式来解析 html,使用 BeautifulSouplxml相反。

关于python 2.7 re.MULTILINE 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9755816/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com