gpt4 book ai didi

python - 带有解析html页面的正则表达式python

转载 作者:太空宇宙 更新时间:2023-11-04 09:20:12 28 4
gpt4 key购买 nike

美好的一天。正则表达式的小问题。

我有一个看起来像的正则表达式

rexp2 = re.findall(r'<p>(.*?)</p>', data)

我需要全力以赴

<div id="header">
<h1></h1>
<p>
localhost OpenWrt Backfire<br />
Load: 0.00 0.00 0.00<br />
Hostname: localhost
</p>
</div>

但是我的代码不起作用:(我做错了什么?

最佳答案

法定警告:这是一个Bad Idea使用正则表达式解析 (X)HTML。

幸运的是,有一个更好的方法。要开始,首先安装 BeautifulSoup模块。接下来,阅读 documentation .三、代码!

这是一种方法来完成您想要做的事情:

from BeautifulSoup import BeautifulSoup
html = """<div id="header">
<h1></h1>
<p>
localhost OpenWrt Backfire<br />
Load: 0.00 0.00 0.00<br />
Hostname: localhost
</p>
</div>"""
soup = BeautifulSoup(html)
for each in soup.findAll(name = 'p'):
print each

关于python - 带有解析html页面的正则表达式python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3651589/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com