gpt4 book ai didi

python - 在 python 中使用正则表达式从 HTML 中提取内容

转载 作者:行者123 更新时间:2023-11-28 04:30:34 24 4
gpt4 key购买 nike

我有这个 HTML 代码

<a class="button block left icon-phone" data-reveal="\u06f0\u06f9\u06f3\u06f6\u06f5\u06f6\u06f8\u06f1\u06f6\u06f2\u06f1"  href="#">

这是一个刺痛,我想在 data-reveal 前面提取内容。我做了一些正则表达式,比如

p = re.compile('data-reveal=*')

但是他们没有工作。我该怎么做 ?谢谢。

最佳答案

您正在使用 the wrong tool为了这。你应该使用像 BeautifulSoup 这样的 Html 解析器.

>>> from bs4 import BeautifulSoup
>>> doc = """<a class="button block left icon-phone" data-reveal="\u06f0\u06f9\u06f3\u06f6\u06f5\u06f6\u06f8\u06f1\u06f6\u06f2\u06f1" href="#">"""
>>> soup = BeautifulSoup(doc, 'html.parser')
>>> print(soup.find('a').get('data-reveal'))
۰۹۳۶۵۶۸۱۶۲۱

关于python - 在 python 中使用正则表达式从 HTML 中提取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36539354/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com